طراحی و پیاده سازی یک سامانه بازیابی اطلاعات دوزبانه با استفاده از پیکره های زبانی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
بازیابی اطلاعات بین زبانی به فرایندی گفته می شود که طی آن یک کاربر، جستاری (یک واژه، عبارت، یا حتی جمله ای) را به یک زبان جستجو می کند درحالی که انتظار دارد نتایج جستجوی خود را به زبان دیگری دریافت نماید. یکی از مشکلات عمده کاربران فارسی زبان در استفاده از منابع موجود در فضای سایبر، عدم امکان بازیابی موضوعات مورد نظر است که این مسأله تا حد زیادی به حجم کم اطلاعات به زبان فارسی در این فضا برمی گردد. استفاده از فرهنگ لغت نیز به دلیل عدم توانایی در ارائه پاسخ مناسب به ترکیبات چندتایی رایج در زبان ها کمتر در این زمینه راه گشاست. طرح حاضر که با هدف یافتن راه حلی مناسب برای این مشکل با تهیه نرم افزار آزمایشگاهی مرتبط تعریف شده است، سعی دارد که با استفاده از پیکره های یک زبانه و دوزبانه و با کمک الگوریتم های رایانه ای راه حل منطقی و مقرون به صرفه ای برای این مشکل ارائه نماید. به منظور آزمودن کیفیت کار سامانه طراحی شده در این طرح، آزمایشی بر روی تعداد 100 ترکیب از زبان فارسی و انگلیسی انجام شد که برونداد سامانه بازیابی اطلاعات برای این مجموعه از ترکیبات بسیار رضایت بخش بوده است. یکی از دستاوردهای اجرایی این طرح، بالا بردن دقت سامانه های بازیابی اطلاعات در موتورهای جستجو است که با استفاده از پیکره و بانک اطلاعاتی، ترکیب بندی واژه ها قابل دسترس است.