احسان الدین عسگری

احسان الدین عسگری

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۲ مورد از کل ۲ مورد.
۱.

ترجمه ماشینی مبتنی بر مدل مبدل برای گویش های لری بویراحمدی و یزدی به فارسی معیار و گسترش منابع زبانی رایانشی مرتبط(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پردازش زبان طبیعی گویش لری گویش یزدی ترجمه تمایزهای زبانی ایرانی مدل یادگیری ژرف ترجمه ماشینی

حوزه های تخصصی:
تعداد بازدید : ۳۴ تعداد دانلود : ۳۰
با وجود تلاش های گسترده رایانشی بر روی گویش معیار فارسی، سایر لهجه ها و گویش ها و زبان های ایرانی کمتر مورد توجه محققین حوزه زبان شناسی رایانشی قرار گرفته اند. یکی از مهم ترین چالش های کار رایانشی بر روی این تمایز های زبانی، نبود یک مجموعه داده دیجیتال و استاندارد است. در این پژوهش اولین مجموعه داده تک زبانه و نیز داده موازی بر روی گویش های لری و یزدی که گویش هایی با منابع محدود محسوب می شوند، در مقابل فارسی معیار ارائه شده است. در ادامه مدل های یادگیری ژرف ترجمه ماشینی کدگذار-کدگشا در دو نوع مدل شبکه عصبی بازگشتی و مدل ژرف مبدل برای این گویش ها به فارسی معیار توسعه یافته و ارزیابی گردیده است. در این پژوهش که اولین تلاش محاسباتی روی این دو گویش محسوب می شود، برای ترجمه لری به فارسی و فارسی به لری به امتیاز BLEU به ترتیب ۳۹/7 و 29/3 رسیدیم. این امتیاز برای گویش یزدی به فارسی معیار و برعکس به 73/0 و 77/0 رسید. که نشان می دهند پژوهش های فراتری برای توسعه منابع زبانی برای این زبان نیاز است.
۲.

فاجیک: مدل شبکه عصبی ژرف کد گذار-کدگشای و منابع زبانی مرتبط برای نویسه گردانی میان تاجیکی و فارسی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: یادگیری ژرف مدل کدگذار-کدگشا نویسه گردانی فارسی تاجیکی

حوزه های تخصصی:
تعداد بازدید : ۹۹ تعداد دانلود : ۸۲
زبان تاجیکی، یا به شکل درست تر گویش تاجیکی زبان فارسی، از گونه های زنده زبان فارسی است که در کشور تاجیکستان رواج دارد. مهم ترین تفاوت فارسی رایج در ایران با فارسی تاجیکی در سیستم نوشتار است که این تفاوت سبب ایجاد گسست فرهنگی میان دو ملتی که گفتار هم را متوجه می شوند، شده است. ساخت سامانه ای برای تبدیل این دو نوشتار می تواند به نزدیکتر کردن این دو ملت کمک شایان ذکری کند. در گذشته تلاش هایی برای ساخت نویسه گردان رایانشی بین این دو گونه نوشتار صورت گرفته است. این سامانه ها با استفاده از روش های سنتی و قانون محور این کار را انجام می دادند و برای همین خطاهای قابل توجهی در خروجی خود دارند. در این پژوهش تلاش شده است که با کمک روش های یادگیری ژرف این نویسه گردانی انجام شود. در دهه گذشته این روش ها تحول عظیمی در زبانشناسی رایانشی ایجاد کرده اند. در این پژوهش ابتدا پیکره موازی میان فارسی و تاجیکی جمع آوری شده است. سپس با کمک مدل های رشته به رشته یک سامانه نویسه گردانی با عملکرد بهتر نسبت به سامانه های گذشته ایجاد شده است.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان