مطالب مرتبط با کلیدواژه

مدل یادگیری ژرف ترجمه ماشینی


۱.

ترجمه ماشینی مبتنی بر مدل مبدل برای گویش های لری بویراحمدی و یزدی به فارسی معیار و گسترش منابع زبانی رایانشی مرتبط(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پردازش زبان طبیعی گویش لری گویش یزدی ترجمه تمایزهای زبانی ایرانی مدل یادگیری ژرف ترجمه ماشینی

حوزه های تخصصی:
تعداد بازدید : ۳۳ تعداد دانلود : ۳۰
با وجود تلاش های گسترده رایانشی بر روی گویش معیار فارسی، سایر لهجه ها و گویش ها و زبان های ایرانی کمتر مورد توجه محققین حوزه زبان شناسی رایانشی قرار گرفته اند. یکی از مهم ترین چالش های کار رایانشی بر روی این تمایز های زبانی، نبود یک مجموعه داده دیجیتال و استاندارد است. در این پژوهش اولین مجموعه داده تک زبانه و نیز داده موازی بر روی گویش های لری و یزدی که گویش هایی با منابع محدود محسوب می شوند، در مقابل فارسی معیار ارائه شده است. در ادامه مدل های یادگیری ژرف ترجمه ماشینی کدگذار-کدگشا در دو نوع مدل شبکه عصبی بازگشتی و مدل ژرف مبدل برای این گویش ها به فارسی معیار توسعه یافته و ارزیابی گردیده است. در این پژوهش که اولین تلاش محاسباتی روی این دو گویش محسوب می شود، برای ترجمه لری به فارسی و فارسی به لری به امتیاز BLEU به ترتیب ۳۹/7 و 29/3 رسیدیم. این امتیاز برای گویش یزدی به فارسی معیار و برعکس به 73/0 و 77/0 رسید. که نشان می دهند پژوهش های فراتری برای توسعه منابع زبانی برای این زبان نیاز است.