چکیده

باهم آیی ها، یعنی ترکیبات بازرخدادی واژه ها که احتمال هم رخدادی آنها بیش از آن چیزی است که تصادفا رخ می دهد در زبان های طبیعی به کرات مشاهده می شوند. از آنجایی که واژه نامه های دوزبانه قادر به ارایه معادل های واژگانی مناسبی برای اغلب این باهم آیی ها نیستند، اکثر قریب به اتفاق سیستم های ترجمه ماشینی در مواجهه با این گونه ترکیبات، اجرای دقیقی نداشته و در نتیجه کیفیت برونداد آنها تا حد قابل ملاحظه ای کاهش می یابد. در سال های اخیر پیکره های یک زبانه در حل مسایل مختلف زبان شناسی، شامل پردازش زبان طبیعی، ترجمه ماشینی آماری، آموزش زبان و سایر حوزه های مرتبط نقش مهمی ایفا نموده اند. مطالعه حاضر فرایند ساخت و استفاده از یک پیکره بزرگ یک زبانه فارسی را مورد بررسی قرار می دهد. این پیکره این امکان را به ما می دهد تا مشکل ابهام باهم آیی های انگلیسی را در حین ترجمه آنها به زبان فارسی توسط یک سیستم ترجمه ماشینی رفع نماییم. با استفاده از چنین پیکره ای به عنوان پیکره زبان مقصد و نیز یک واژه نامه دوزبانه انگلیسی-فارسی، کارآیی این پیکره در یافتن مناسب ترین معادل فارسی برای باهم آیی های انگلیسی، به منظور ارتقای کیفیت سیستم ترجمه ماشینی، مورد ارزیابی قرار می گیرد. نتایج آزمایشی که در این راستا بر روی یک پیکره آزمون صورت گرفت بسیار امیدبخش بوده و صحت آن به 90.83% رسیده است.

تبلیغات