مطالب مرتبط با کلیدواژه

پیکره موازی


۱.

ابهام زدایی واژگانی صفات مبهم در ترجمه ماشینی: بررسی پیکره بنیاد(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ترجمه ماشینی صفات چند معنایی ابهام زدایی واژگانی پیکره موازی کشف اللغات

حوزه‌های تخصصی:
  1. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی کتابخانه های الکترونیکی فهرست نویسی منابع اطلاعاتی الکترونیکی
  2. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات سازماندهی اطلاعات
  3. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات ذخیره و بازیابی اطلاعات
تعداد بازدید : ۱۳۰۱ تعداد دانلود : ۱۲۳۱
موضوع ابهام در معانی واژه ها و ساختار ها و چگونگی برطرف کردن آن به ویژه به هنگام ترجمه ماشینی ذهن بسیاری از محققان را در این حوزه به خود مشغول داشته و برای آن راهکار های گوناگونی ارائه شده است. در این مقاله بر آنیم تا به ابهام موجود در واژه ها بپردازیم.صفات و نامهای مبهم با تعدد معانی خود دشواریهایی را در ترجمه ماشینی بوجود می آورند . در برنامه های خودکار که اراده انسانی در انتخاب معادل دخالتی ندارد این موضوع عیان تر است. ماشین نمی تواند بر اساس بافت به صورت خودکار بهترین معادل را انتخاب کند حال آنکه به کمک زبانشناسی رایانه ای و بکار گیری پیکره ها این امر ممکن است. در پژوهش حاضر به منظور اثبات این توانایی از میان دو مقوله اسم و صفت ، صفات را برای بررسی انتخاب کردیم. برای این کار کلیه ی صفات انگلیسی موجود در یک فرهنگ متوسط ( فرهنگ هزاره) را به همراه معانی متعدد آنها استخراج کرده و ضبط کردیم، آنگاه این صفات را در یک کشف اللغات موازی انگلیسی به فارسی قرار دادیم و جملاتی را که این صفات در آنها به کار رفته بودند ضبط کرده و این صفات را به همراه بافت و معنا استخراج کردیم و فهرستی به صورت یک کشف اللغات تهیه کردیم. برنامه ای برای این کشف اللغات نوشته شد به گونه ای که از میان معانی موجود بالاترین بسامد معنایی به همراه با هم آیی و بدون آن به عنوان معادل به هنگام ترجمه انتخاب شود. معادل های انتخاب شده رامترجمین انسانی نیز آزمودند و نتایج نشان دادند که در بیش از 50 درصد موارد معادل های انتخاب شده از سوی مترجمین با آنچه که برنامه ابهام زدایی انتخاب کرده بود یا یکسان و یا بسیار نزدیک بودند. نتایج حاصل از این پژوهش در امر ترجمه ماشینی، بازیابی اطلاعات دوزبانه، ایجاد شبکه های واژگانی و آموزش زبان فارسی سودمند خواهد بود.
۲.

استخراج خودکار جملات هم تراز انگلیسی-فارسی از متون مقایسه ای با بهره برداری از اطلاعات نحوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: استخراج خودکار جملات همتراز زبانشناسی پیکره ای پیکره مقایسه ای پیکره موازی

حوزه‌های تخصصی:
تعداد بازدید : ۴۸۰ تعداد دانلود : ۴۱۹
پیکره های موازی همواره از غنی ترین منابع در مباحث پردازش زبان طبیعی محسوب می شوند.  این نوع پیکره ها شامل متون ترجمه شده دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم ترازشده اند. علیرغم کاربرد فراوان این نوع پیکره ها در مطالعات مختلف از جمله پژوهش های زبانی، ترجمه ماشینی آماری و سامانه های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره های موازی مواجه بوده اند. در این راستا، در پژوهش حاضر سعی شده است به منظور تولید پیکره موازی با بهره گیری از اطلاعات نحوی، روشی خودکار برای استخراج جملات هم ترازانگلیسی/فارسی از متون مقایسه ای ارائه شود. در این روش، با ساخت بردار ویژگی با بهره گیری از اطلاعات نحوی جملات، یک مدل هم ترازی آموزش داده می شود. دقت مدل هم ترازی،در بهترین حالت، به شکل عملیاتی روی داده های آزمون (208 عدد جفت جمله) 77% و روی داده های آموزشی (830 عدد جفت جمله) 7/97 % محاسبه شد. از آنجایی که حجم داده های طلایی بسیار کوچک بود روش n-fold cross validation در مورد تمام الگوریتم های آموزش مورد استفاده قرار گرفت. به منظور افزایش دقت، از یک الگوریتم جست وجوی شباهت لغوی جملات نیز استفاده شد که دقت را روی داده های آزمون از 77% به 18/85% افزایش داد. پژوهش حاضر، با به کارگیری مدل هم ترازی به دست آمده، به تولید ابزار هم ترازی دانشگاه اصفهان منجر شد، که می تواند به منظور خودکفایی در تولید پیکره های موازی مورداستفاده محققین حوزه پردازش زبان فارسی قرار گیرد.
۳.

ترجمه گزاره های فراگفتمانی در گفتمان سیاسی تد: بررسی کم تخصیصی معنایی میان زبان انگلیسی و فارسی در پیکره موازی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: فراگفتمان فراگفتمان تبادلی گذاره های فراگفتمانی ترجمه کم تخصیصی پیکره موازی

حوزه‌های تخصصی:
تعداد بازدید : ۳۸۸ تعداد دانلود : ۲۹۹
گزاره های فراگفتمانی از عناصر مهم فراگفتمانی اند که برای برقراری ارتباط میان بخش های مختلف گفتمان و همچنین کمک به مخاطبان (خواننده و شنونده) در درک روابط کاربردشناختی به کار می روند. پژوهش حاضر با هدف بررسی این عناصر فراگفتمانی و ارائه پژوهشی پیکره محور و مقایسه ای بر روی برخی از مهم ترین گزاره های فراگفتمانی موجود در زبان انگلیسی و فارسی انجام شد. بدین منظور، تعداد ده سخنرانی تد با محوریت ژانر سیاسی به زبان انگلیسی به صورت تصادفی انتخاب و به همراه ترجمه فارسی آن در نرم افزار پیکره ساز اسکچ انجین بارگذاری شد. برای بررسی و دسته بندی گزاره های فراگفتمانی، چهارچوب هایلند (2005) انتخاب شد. در این چهارچوب عناصر فراگفتمانی به دو دسته اصلی تبادل و تعامل، تقسیم می شوند که گزاره ها در دسته نخست قرار می گیرند. از بررسی های مقابله ای میان این عناصر و ترجمه فارسی آن ها، این موضوع دریافت شد که به طور کلی فرایند ترجمه این عناصر را می توان در قالب دو راهبرد کلی (ترجمه تحت اللفظی و کم تخصیصی) توصیف نمود که فرایند کم تخصیصی خود متشکل از سه نوع دیگر (حذف، توسیع و تحدید) است. از دیگر یافته های این پژوهش می توان به درک وجود رابطه ای معنادار میان نوع گزاره ها و نوع خاص راهبرد به کاررفته اشاره کرد. با استفاده از عملیات آماری و کمی حاصل از بررسی داده های موجود مشخص شد گزاره های قوی غالباً به صورت تحت اللفظی ترجمه می گردند، در حالی که گزاره های ضعیف نظیر and گاهی اوقات به صورت تحت اللفظی و گاهی تحت عنوان فرایندهای کم تخصیصی ترجمه می شوند. یافته های این تحقیق می تواند در پژوهش های آتی در زمینه مطالعات ترجمه پیکره محور و زبان شناسی مقابله ای استفاده شود.
۴.

کاربرد پیکره های موازی برای تفکیک معنایی/مفهومی در ترجمه و فرهنگ نگاری دو زبانه(مقاله علمی وزارت علوم)

کلیدواژه‌ها: متن شناسی مقابله ای پیکره موازی تفکیک معنایی/مفهومی ترجمه فرهنگ نگاری دوزبانه

حوزه‌های تخصصی:
تعداد بازدید : ۱۰۸ تعداد دانلود : ۱۰۱
هدف این پژوهش ارائه راه کاری عملی و پیکره بنیاد برای تفکیک معنایی واژه ها و یافتن معادل های مناسب برای آنها با رویکرد«متن شناسی مقابله ای» هارتمن (1980) و استفاده از پیکره های دوزبانه نخست در فرایند ترجمه و سپس در تدوین فرهنگ های دوزبانه است. این تحقیق می کوشد مطمئن ترین روش را برای یافتن بهترین معادل ها در بافت های زبانی مختلف ارائه دهد. بدین منظور، پژوهشگران به ترتیب از دو پیکره دوزبانه یا موازی میزان و تهران که جامع ترین و مناسب ترین پیکره های موجود بودند بهره گرفتند. نگارندگان نخست،تعداد 100 واژه را از پربسامدترینواژه های قاموسی دو پیکره که دارای تعدّد معنایی مناسبی بوده یا به اصطلاح چندمعنا بودند با استفاده از ابزار تحلیل پیکره Wordsmith استخراج کرده و آنها را در پیکره انگلیسی جستجو کردند و جمله های شاهد را با ترجمه فارسی تراز شده آنها مقابله کردند تا معانی فارسی به کار رفته را برای این واژه ها در پیکره فارسیگرد آوری و فهرست کنند. سپس معانی یافته شده با معادل های آنها در فرهنگ انگلیسی به فارسی هزاره مقایسه شد تا مشخّص شود کدامیک از این دو منبع (پیکره موازی یا فرهنگ دوزبانه) معادل های گسترده تر و کامل تری را با توجّه به بافت زبانی در اختیار مترجم قرار می دهد.نتایج نشان داد که این پیکره های دوزبانه که از بزرگی و گستردگی چندانی هم برخوردار نیستند، در قیاس با فرهنگ بررسی شده در بیشتر موارد معانی متفاوت، متنوع و گاه بیشتری را در اختیار مترجمان و فرهنگ نویسان قرار می دهند.