ساخت هستانشناسی دانش عرفی زبان فارسی با رویکردی تلفیقی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
تجهیز رایانه ها به دانش عرفی بشر همواره یکی از جاه طلبانه ترین اهداف علم هوش مصنوعی بوده است. میلیون ها دلار هزینه و هزاران ساعت زمان صرف شده تا رایانه ها بفهمند که “اشیا بالا نمی روند، بلکه می افتند” و “دویدن از راه رفتن سریع تر است”. پایگاه های دانش عظیمی ساخته شد، روش های خودکار و نیمه خودکار متن کاوی پیشنهاد شده و از انگیزه همکاری کاربران عادی اینترنت به نفع اکتساب این دانش بهره ها برده شده است. ولی رسیدن به روشی خودکار، مؤثر و کم خطا همچنان به صورت چالشی بزرگ پیش روی جامعه هوش مصنوعی باقی مانده است. هدف این تحقیق ساخت هستان شناسی دانش عرفی فارسی به کمک سه روش مبتنی بر الگو، ترجمه ماشینی و استفاده از منابع ساخت یافته است. با کمک سه پیکره مختلف فارسی هفت نوع رابطه و در مجموع هفتاد هزار اظهار (رابطه) استخراج شده و در قالب یک هستان شناسی ارائه گشت. نتایج بررسی گویش وران فارسی نشان داد که میانگین دقت روابط استخراج شده این هستان شناسی برابر با 75% برای روش مبتنی بر الگو، 70% برای ترجمه ماشینی و 100% برای اطلاعات استخراج شده از جعبه اطلاعات بود.