مطالب مرتبط با کلید واژه " پیکره موازی "


۱.

ابهام زدایی واژگانی صفات مبهم در ترجمه ماشینی: بررسی پیکره بنیاد

کلید واژه ها: ترجمه ماشینیصفات چند معناییابهام زدایی واژگانیپیکره موازیکشف اللغات

حوزه های تخصصی:
  1. حوزه‌های تخصصی علوم کتابداری کتابخانه های الکترونیکی فهرست نویسی منابع اطلاعاتی الکترونیکی
  2. حوزه‌های تخصصی علوم کتابداری علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات سازماندهی اطلاعات
  3. حوزه‌های تخصصی علوم کتابداری علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات ذخیره و بازیابی اطلاعات
تعداد بازدید : ۵۳۵ تعداد دانلود : ۳۰۸
موضوع ابهام در معانی واژه ها و ساختار ها و چگونگی برطرف کردن آن به ویژه به هنگام ترجمه ماشینی ذهن بسیاری از محققان را در این حوزه به خود مشغول داشته و برای آن راهکار های گوناگونی ارائه شده است. در این مقاله بر آنیم تا به ابهام موجود در واژه ها بپردازیم.صفات و نامهای مبهم با تعدد معانی خود دشواریهایی را در ترجمه ماشینی بوجود می آورند . در برنامه های خودکار که اراده انسانی در انتخاب معادل دخالتی ندارد این موضوع عیان تر است. ماشین نمی تواند بر اساس بافت به صورت خودکار بهترین معادل را انتخاب کند حال آنکه به کمک زبانشناسی رایانه ای و بکار گیری پیکره ها این امر ممکن است. در پژوهش حاضر به منظور اثبات این توانایی از میان دو مقوله اسم و صفت ، صفات را برای بررسی انتخاب کردیم. برای این کار کلیه ی صفات انگلیسی موجود در یک فرهنگ متوسط ( فرهنگ هزاره) را به همراه معانی متعدد آنها استخراج کرده و ضبط کردیم، آنگاه این صفات را در یک کشف اللغات موازی انگلیسی به فارسی قرار دادیم و جملاتی را که این صفات در آنها به کار رفته بودند ضبط کرده و این صفات را به همراه بافت و معنا استخراج کردیم و فهرستی به صورت یک کشف اللغات تهیه کردیم. برنامه ای برای این کشف اللغات نوشته شد به گونه ای که از میان معانی موجود بالاترین بسامد معنایی به همراه با هم آیی و بدون آن به عنوان معادل به هنگام ترجمه انتخاب شود. معادل های انتخاب شده رامترجمین انسانی نیز آزمودند و نتایج نشان دادند که در بیش از 50 درصد موارد معادل های انتخاب شده از سوی مترجمین با آنچه که برنامه ابهام زدایی انتخاب کرده بود یا یکسان و یا بسیار نزدیک بودند. نتایج حاصل از این پژوهش در امر ترجمه ماشینی، بازیابی اطلاعات دوزبانه، ایجاد شبکه های واژگانی و آموزش زبان فارسی سودمند خواهد بود.
۲.

استخراج خودکار جملات هم تراز انگلیسی-فارسی از متون مقایسه ای با بهره برداری از اطلاعات نحوی

تعداد بازدید : ۴۳ تعداد دانلود : ۳۸
پیکره های موازی همواره از غنی ترین منابع در مباحث پردازش زبان طبیعی محسوب می شوند.  این نوع پیکره ها شامل متون ترجمه شده دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم ترازشده اند. علیرغم کاربرد فراوان این نوع پیکره ها در مطالعات مختلف از جمله پژوهش های زبانی، ترجمه ماشینی آماری و سامانه های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره های موازی مواجه بوده اند. در این راستا، در پژوهش حاضر سعی شده است به منظور تولید پیکره موازی با بهره گیری از اطلاعات نحوی، روشی خودکار برای استخراج جملات هم ترازانگلیسی/فارسی از متون مقایسه ای ارائه شود. در این روش، با ساخت بردار ویژگی با بهره گیری از اطلاعات نحوی جملات، یک مدل هم ترازی آموزش داده می شود. دقت مدل هم ترازی،در بهترین حالت، به شکل عملیاتی روی داده های آزمون (208 عدد جفت جمله) 77% و روی داده های آموزشی (830 عدد جفت جمله) 7/97 % محاسبه شد. از آنجایی که حجم داده های طلایی بسیار کوچک بود روش n-fold cross validation در مورد تمام الگوریتم های آموزش مورد استفاده قرار گرفت. به منظور افزایش دقت، از یک الگوریتم جست وجوی شباهت لغوی جملات نیز استفاده شد که دقت را روی داده های آزمون از 77% به 18/85% افزایش داد. پژوهش حاضر، با به کارگیری مدل هم ترازی به دست آمده، به تولید ابزار هم ترازی دانشگاه اصفهان منجر شد، که می تواند به منظور خودکفایی در تولید پیکره های موازی مورداستفاده محققین حوزه پردازش زبان فارسی قرار گیرد.