طیبه موسوی میانگاه

طیبه موسوی میانگاه

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۱۲ مورد از کل ۱۲ مورد.
۱.

نقش پیکره های بزرگ یک زبانه در بهبود کیفیت ترجمه ماشینی(مقاله علمی وزارت علوم)

کلید واژه ها: زبان فارسی ابهام واژگانی ترجمه ماشینی با هم آبی ها پیکره یک زبانه

حوزه های تخصصی:
تعداد بازدید : 281
باهم آیی ها، یعنی ترکیبات بازرخدادی واژه ها که احتمال هم رخدادی آنها بیش از آن چیزی است که تصادفا رخ می دهد در زبان های طبیعی به کرات مشاهده می شوند. از آنجایی که واژه نامه های دوزبانه قادر به ارایه معادل های واژگانی مناسبی برای اغلب این باهم آیی ها نیستند، اکثر قریب به اتفاق سیستم های ترجمه ماشینی در مواجهه با این گونه ترکیبات، اجرای دقیقی نداشته و در نتیجه کیفیت برونداد آنها تا حد قابل ملاحظه ای کاهش می یابد. در سال های اخیر پیکره های یک زبانه در حل مسایل مختلف زبان شناسی، شامل پردازش زبان طبیعی، ترجمه ماشینی آماری، آموزش زبان و سایر حوزه های مرتبط نقش مهمی ایفا نموده اند. مطالعه حاضر فرایند ساخت و استفاده از یک پیکره بزرگ یک زبانه فارسی را مورد بررسی قرار می دهد. این پیکره این امکان را به ما می دهد تا مشکل ابهام باهم آیی های انگلیسی را در حین ترجمه آنها به زبان فارسی توسط یک سیستم ترجمه ماشینی رفع نماییم. با استفاده از چنین پیکره ای به عنوان پیکره زبان مقصد و نیز یک واژه نامه دوزبانه انگلیسی-فارسی، کارآیی این پیکره در یافتن مناسب ترین معادل فارسی برای باهم آیی های انگلیسی، به منظور ارتقای کیفیت سیستم ترجمه ماشینی، مورد ارزیابی قرار می گیرد. نتایج آزمایشی که در این راستا بر روی یک پیکره آزمون صورت گرفت بسیار امیدبخش بوده و صحت آن به 90.83% رسیده است.
۲.

استفاده از فناوری پیکره ها در آموزش زبان انگلیسی(مقاله علمی وزارت علوم)

کلید واژه ها: یادگیری زبان دوم زبان شناسی پیکره ای آموزش زبان انگلیسی بعنوان زبان خارجی فناوری پیکره ها یادگیری مبتنی بر پیکره

حوزه های تخصصی:
تعداد بازدید : 639 تعداد دانلود : 712
این مطالعه کوششی درجهت بررسی اعمال روش داده گرای مبتنی بر پیکره های زبانی، به شیوه ای استنتاجی و فراگیرمحور در کلاس های آموزش زبان انگلیسی به عنوان زبان خارجی است. به طور مشخص، در این پژوهش به ارزیابی راهکارهای بالقوة دانشجویان ایرانی در کلاس های درس آموزش زبان انگلیسی در استفاده از پیکره های بسیار بزرگ یک زبانه برای جست وجوی الگوهای دستوری خاص می پردازیم. نتایج به دست آمده از این تحقیق نشان می دهد که رای زنی با پیکره ها به عنوان مکمل ابزار سنتی یادگیری زبان مانند کتاب های دستور زبان، واژه نامه های یک زبانه و واژه نامه های دوزبانه و غیره، تأثیر بسزایی در یادگیری زبان دوم در کلاس های درس داشته است. همچنین، نتایج بیانگر این است که با بالارفتن سطح مهارت زبانی دانشجویان، تأثیر پیکره بر خودآموزی آنان نیز افزایش می یابد. میانگین پیشرفت کلی دانشجویان در سطوح مختلف زبانی با استفاده از پیکره ها 4/18% است که در نوع خود بسیار امیدوارکننده می باشد
۳.

کاربرد پیکره ها در ترجمه(مقاله علمی وزارت علوم)

حوزه های تخصصی:
تعداد بازدید : 123
"ما در دنیای فناوری زندگی می کنیم و رایانه ها با حوزه های کاربردی فراوانشان هر روزه بیشتر و بیشتر وارد زندگی شخصی و کاری ما می شوند. مترجمان نیز از این امر مستثنی نیستند. ساخت و استفاده از پیکره ها از جمله کاربردهای رایانه ها هستند که کمک بزرگی برای مترجمان به حساب می آیند. این مقاله به بررسی مشکلاتی در فرایند ترجمه می پردازد که به آسانی با استفاده از پیکره های یک زبانه و دوزبانه قابل حل است و نیز مزایای استفاده از این گونه پیکره ها را بیان می دارد. نشان دادن مزایای پیکره های مقصد یک زبانه به عنوان کمک مترجم مساله اصلی مورد بحث در این مقاله است و مزایای اشکال مختلف پیکره های دوزبانه در مقاله دیگری به طور کامل بحث خواهد شد. هدف این مقاله شرح دو روش از روشهایی است که دانشجویان به وسیله آنها می توانند از پیکره های مقصد یک زبانه به منظور بهبود بخشیدن به کیفیت ترجمه هایشان استفاده نمایند: یافتن اطلاعاتی در مورد واژه های همنشین به ویژه صفتهای همراه با اسمها، و تایید یا رد معادلهای ترجمانی اصطلاحات و عبارات خاص که توسط واژه نامه ها ارایه شده اند. "
۴.

استفاده از فناوری جدید در ترجمه

حوزه های تخصصی:
تعداد بازدید : 868
توسعه سریع صنعت ترجمه در جهان امروز مبین نیاز روزافزون به ابزار ترجمه است. این مقاله می کوشد تا بررسی اجمالی در زمینه ابزارهای مختلف ترجمه داشته باشد. این ابزارها به عنوان کمکهای بسیار مفیدی برای مترجمان در کار ترجمه محسوب می شوند که از مهم ترین آنها می توان به حافظه های ترجمه، فرهنگهای یک زبانه و دو زبانه ماشین خوان و ترجمه ماشینی اشاره نمود. استفاده از فناوریهای جدید در امر ترجمه نه تنها به کار مترجم سرعت بخشیده بلکه ثبات و کارآیی ترجمه را نیز افزایش می دهد.
۵.

نقش ترجمه در گفتگوی تمدنها

حوزه های تخصصی:
تعداد بازدید : 42
ن"ترجمه فرهنگها را به یکدیگر نزدیک می سازد. در دنیای جهانی شده کنونی ما، ترجمه کلید درک و فهم فرهنگهای خارجی است. در این تحقیق سعی شده است که رابطه متقابل بین فرهنگ و زبان نشان داده شود و نظرات مختلف در این مورد مرور شود. تفاوت بین فرهنگها و تمدنها و همچنین تاثیر ترجمه در برقراری ارتباط بین اعتقادات، زبانها، ادیان، اندیشه ها و فرهنگهای مختلف و در تسهیل فرایند گفتگوی تمدنها با در نظر گرفتن جنبه های قوم شناختی تفاوتهای فرهنگی و مساله ترجمه پذیری در برابر ترجمه ناپذیری عناصر فرهنگی بر اساس نظریه های وورف و چامسکی مورد مطالعه قرار گرفته است."
۶.

اطلس گویشی و گویش سنجی کرانه جنوب شرقی دریای مازندران به روش بسامد واکه(مقاله علمی وزارت علوم)

کلید واژه ها: زبان مازندرانی اطلس گویشی گویش سنجی روش بسامد واکه

حوزه های تخصصی:
تعداد بازدید : 681 تعداد دانلود : 27
گویش سنجی روشی کمّی برای اندازه گیری تفاوت های میان گویش های مختلف است که با محاسبه آماری مقدار این تمایزات در نمونه های گسترده ای از ویژگی های زبانی در یک منطقه گویشی به دست می آید. هدف پژوهش حاضر نیز ارائه نمونه ای از اطلس گویشی استان مازندران بر مبنای روش های گویش سنجی است. در پژوهش حاضر که مبتنی بر روش توصیفی هم زمانی و دادگان میدانی است، آوانگاشت معادل های محلّی 62 واژه مورد تحلیل انبوهه قرار گرفت و منطقه های گویشی کرانه های جنوبی دریای مازندران بر اساس بسامد واکه ها مکان یابی شده است. موادّ زبانی متشکل از 73 مصاحبه است. میانگین سنی گویشوران 36 سال، متوسط سواد آنها در حد آموزش ابتدایی و 38% آنها زن بودند. نقشه های تفسیری حاصل ضمن تعیین چهار منطقه گویشی شمال غربی، غربی، شمال شرقی، و جنوب مرکز با آلفای کرنباخ 84/0، نشان می دهد که واکه های پیشین /i/ و /a/، بیشترین شاخص تأثیر را در گوناگو نی های منطقه ای دارند.
۷.

ابهام زدایی واژگانی صفات مبهم در ترجمه ماشینی: بررسی پیکره بنیاد(مقاله علمی وزارت علوم)

کلید واژه ها: ترجمه ماشینی صفات چند معنایی ابهام زدایی واژگانی پیکره موازی کشف اللغات

حوزه های تخصصی:
  1. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی کتابخانه های الکترونیکی فهرست نویسی منابع اطلاعاتی الکترونیکی
  2. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات سازماندهی اطلاعات
  3. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات ذخیره و بازیابی اطلاعات
تعداد بازدید : 437 تعداد دانلود : 933
موضوع ابهام در معانی واژه ها و ساختار ها و چگونگی برطرف کردن آن به ویژه به هنگام ترجمه ماشینی ذهن بسیاری از محققان را در این حوزه به خود مشغول داشته و برای آن راهکار های گوناگونی ارائه شده است. در این مقاله بر آنیم تا به ابهام موجود در واژه ها بپردازیم.صفات و نامهای مبهم با تعدد معانی خود دشواریهایی را در ترجمه ماشینی بوجود می آورند . در برنامه های خودکار که اراده انسانی در انتخاب معادل دخالتی ندارد این موضوع عیان تر است. ماشین نمی تواند بر اساس بافت به صورت خودکار بهترین معادل را انتخاب کند حال آنکه به کمک زبانشناسی رایانه ای و بکار گیری پیکره ها این امر ممکن است. در پژوهش حاضر به منظور اثبات این توانایی از میان دو مقوله اسم و صفت ، صفات را برای بررسی انتخاب کردیم. برای این کار کلیه ی صفات انگلیسی موجود در یک فرهنگ متوسط ( فرهنگ هزاره) را به همراه معانی متعدد آنها استخراج کرده و ضبط کردیم، آنگاه این صفات را در یک کشف اللغات موازی انگلیسی به فارسی قرار دادیم و جملاتی را که این صفات در آنها به کار رفته بودند ضبط کرده و این صفات را به همراه بافت و معنا استخراج کردیم و فهرستی به صورت یک کشف اللغات تهیه کردیم. برنامه ای برای این کشف اللغات نوشته شد به گونه ای که از میان معانی موجود بالاترین بسامد معنایی به همراه با هم آیی و بدون آن به عنوان معادل به هنگام ترجمه انتخاب شود. معادل های انتخاب شده رامترجمین انسانی نیز آزمودند و نتایج نشان دادند که در بیش از 50 درصد موارد معادل های انتخاب شده از سوی مترجمین با آنچه که برنامه ابهام زدایی انتخاب کرده بود یا یکسان و یا بسیار نزدیک بودند. نتایج حاصل از این پژوهش در امر ترجمه ماشینی، بازیابی اطلاعات دوزبانه، ایجاد شبکه های واژگانی و آموزش زبان فارسی سودمند خواهد بود.
۸.

استخراج خودکار معادل های واژگانی از پیکره های دو زبانه موازی(مقاله علمی وزارت علوم)

کلید واژه ها: ترجمه خودکار مطابقه دو زبانه بازیافت اطلاعات استخراج معادل های واژگانی پیکره موازی انگلیسی-فارسی

حوزه های تخصصی:
تعداد بازدید : 256 تعداد دانلود : 680
امروزه به مدد ظهور انواع فناوری های رایانه ای، پیکره های زبانی نقش بسیار مهمی در حل انواع مختلف مسائل زبانشناختی ایفا می کنند. پیکره های دو زبانه موازی در سطح جمله و در سطح واژه می توانند برای بازیابی واحدهای تک واژه ای و یا حتی چند واژه ای براحتی مورد استفاده قرار گیرند که این امر کاربردهای مفیدی در حوزه های مختلف رایانه و زبان خواهد داشت. هدف این مقاله به کارگیری یک پیکره موازی انگلیسی– فارسی از قبل طراحی شده در جهت ساخت یک مطابقه[1] (کشف اللغات) دو زبانه کارآمد با استفاده از آماره اطلاعات متقابل است. در اینجا از آماره اطلاعات متقابل استفاده می شود تا همترازی در سطح واژه بین جملات انگلیسی و فارسی پیکره مورد نظر صورت گیرد. یک پیکره زبانی همتراز شده در سطح واژه مسلماً کاربردهای زیادی از جمله در تهیه نرم افزار حافظه ترجمه، مدیریت مجموعه اصطلاحات، بازیابی اطلاعات دوزبانه، سیستم ترجمه ماشینی مبتنی بر آمار و مانند آن دارد. با استفاده از یک الگوریتم ابتکاری آزمایشی ترتیب داده شده و مقایسه ای بین برونداد همترازسازی خودکار با جملات همتراز شده توسط مترجم انسانی صورت گرفت. نتایج این آزمایش نشان داد که برنامه مطابقه گزارش شده در این تحقیق می تواند صحتی معادل 75 درصد را به دست آورد.
۹.

طراحی و پیاده سازی یک سامانه بازیابی اطلاعات دوزبانه با استفاده از پیکره های زبانی(مقاله علمی وزارت علوم)

کلید واژه ها: عامل های هوشمند بازیابی اطلاعات دوزبانه پیکره های زبانی معادل های واژگانی ترجمه خودکار

حوزه های تخصصی:
تعداد بازدید : 905 تعداد دانلود : 208
بازیابی اطلاعات بین زبانی به فرایندی گفته می شود که طی آن یک کاربر، جستاری (یک واژه، عبارت، یا حتی جمله ای) را به یک زبان جستجو می کند درحالی که انتظار دارد نتایج جستجوی خود را به زبان دیگری دریافت نماید. یکی از مشکلات عمده کاربران فارسی زبان در استفاده از منابع موجود در فضای سایبر، عدم امکان بازیابی موضوعات مورد نظر است که این مسأله تا حد زیادی به حجم کم اطلاعات به زبان فارسی در این فضا برمی گردد. استفاده از فرهنگ لغت نیز به دلیل عدم توانایی در ارائه پاسخ مناسب به ترکیبات چندتایی رایج در زبان ها کمتر در این زمینه راه گشاست. طرح حاضر که با هدف یافتن راه حلی مناسب برای این مشکل با تهیه نرم افزار آزمایشگاهی مرتبط تعریف شده است، سعی دارد که با استفاده از پیکره های یک زبانه و دوزبانه و با کمک الگوریتم های رایانه ای راه حل منطقی و مقرون به صرفه ای برای این مشکل ارائه نماید. به منظور آزمودن کیفیت کار سامانه طراحی شده در این طرح، آزمایشی بر روی تعداد 100 ترکیب از زبان فارسی و انگلیسی انجام شد که برونداد سامانه بازیابی اطلاعات برای این مجموعه از ترکیبات بسیار رضایت بخش بوده است. یکی از دستاوردهای اجرایی این طرح، بالا بردن دقت سامانه های بازیابی اطلاعات در موتورهای جستجو است که با استفاده از پیکره و بانک اطلاعاتی، ترکیب بندی واژه ها قابل دسترس است.
۱۰.

بازشناسیِ زبان شناختی و جغرافیایی گونه های زبان مازندرانی در حد فاصل خلیج گرگان تا مرکز مازندران با اعمال روش های گویش سنجی بر تفاوت های آوایی(مقاله علمی وزارت علوم)

کلید واژه ها: گویش سنجی زبان شناسی رایانشی تحلیل انبوهه تفاوت هایآوایی زبان مازندرانی (طبری)

حوزه های تخصصی:
تعداد بازدید : 800 تعداد دانلود : 320
پژوهش حاضر اولین تلاشی است که از یک سو با اتخاذ رویکردی کمّی- رایانشی و از سوی دیگر با رویکردی کل گرایانه، سعی در بررسی گونه های زبان مازندرانی (طبری) و ترسیم چشم اندازی نسبتاً روشن از وضعیت پیوستار گویشی این منطقه در چهارچوب مطالعات گویش سنجی دارد. برای تدوین اطلس زبانی 73 سایت در قلمرو گویشی گسترده پژوهش - که از شمال به شبه جزیرة میانکاله و دریای مازندران، از جنوب به دامنه های رشته کوه البرز، از شرق به خلیج گرگان و از غرب به شهرستان های بابلسر و سوادکوه محدود می شود- مشخص شد. داده های پژوهش شامل معادل های آوایی 62 مدخل واژگانی (جمعاً 4521 معادل) است که از مواد زبانی معتبر «طرح ملی اطلس زبانی ایران» استخراج گردید. میانگین سنی گویشوران 36 سال و متوسط سواد آن ها در حد آموزش ابتدایی است که 38% آن ها زن هستند. تحلیل انبوهه داده ها ضمن نمایاندن کارآمدی رهیافت گویش سنجی بر رهیافت سنتی، نشان داد دو گروه گویشی مازندرانی و مازندرانیِ گالشی از هم متمایزند و نیز گروه گویشی مازندرانی، خود به چهار زیرگروه اصلی بخش می شود که تغییرات پیوستار گویشی آن ها از جنوب شرقی به شمال غربی است. گویش منطقه ای شمال شرق حول شبه جزیرة میانکاله، گویش منطقه ای جنوب شرق بخش گلوگاه، گویش منطقه ای مرکز حول مناطق مرکزی شهرستان های نکا و ساری و گویش منطقه ای غرب شهرستان جویبار را پوشش می دهد.
۱۱.

بررسی تکنیک های بهبود عملکردروش های بسامدشماری پیکره بنیاد دراستخراج خودکار واژگان مورد مطالعه: (واژگان پایه علوم پزشکی)(مقاله علمی وزارت علوم)

کلید واژه ها: استخراج خودکار واژگان علوم پزشکی پیکره روشهای ترکیبی استخراج آموزش زبان فارسی بازیابی اطلاعات

حوزه های تخصصی:
تعداد بازدید : 333 تعداد دانلود : 145
امروزه شاهد گسترش استفاده از روش های پیکره بنیاد در زبان شناسی هستیم. پژوهش حاضر به بررسی تکنیک های بهبود عملکرد روش های بسامد شماری در زبان فارسی و با منظور دستیابی به رویه علمی جهت استخراج خودکار واژگان پایه علوم پزشکی انجام پذیرفته است.استفاده از روشهای آماری در کنار ابزار زبانشناسی پیکره ای ( روشهای استخراج خودکار ترکیبی )جهت استخراج خودکار واژگان در تعدادی از زبانهای دنیا همچون انگلیسی ،فرانسه،ژاپنی و کره ای طی چند دهه اخیر بسیار رایج بوده است ، حال آنکه در زبان فارسی این روشها تا کنون به صورت جدی مورد استفاده قرارگرفته نشده اند و اغلب استخراج ها در زبان فارسی به روش سنتی انجام گرفته اند. ضمن آنکه بکار گیری این روشها در هر زبانی متفاوت است و در هر زبان با توجه به ویژگیهای زبانشاختی آن زبان برون داد روشهای آماری متفاوت است. از این رو باید مطابق با ویژگیهای هر زبان در این روشها تغییراتی اعمال کرد تا در نهایت بتوان به روشی جهت استخراج خودکار واژگان دست یافت.جهت نیل به این هدف در زبان فارسی، از خانواده مدل های بسامد شماری با رویکردهای بسامد شماری پیکره عمومی، بسامد شماری پیکره اختصاصی و روش های بهبودیافته آن ها استفاده شده است. بسامدشماری به کار رفته در پژوهش، برپایه پردازش اطلاعات واژگان در دو پیکره اصلی و اختصاصی که محقق آنرا ایجاد کرده است و از این پس آنرا پیکره محقق ساخته می نامیم، صورت گرفته است . پیکره محقق ساخته شامل متون درس زیست شناسی دوره اول تا چهارم دبیرستان، متون درس علوم دوم و سوم راهنمایی، متون تدریس شده در مرکزآموزش زبان فارسی امام خمینی قزوین، مجلات و مقالات حوزه پزشکی عمومی و پیکره عمومی مورد استفاده ، پیکره روزنامه همشهری ( نسخه دوم) می باشد. نتایج بدست آمده نشان می دهد که قابلیت استفاده از روش های بسامد شماری پیکره بنیاد در زبان فارسی برای دست یافتن به شیوه ای واحد در استخراج خودکار واژگان وجود دارد.شیوه آتی که به یقین می تواند گامی موثر در تهیه و تدوین متون آموزشی زبان فارسی و گسترش آموزش این زبان به شمار آید. از عمده ترین مشکلات استفاد از روش های ساده، جداسازی واژگان پرتکرار همچون حروف ربط را می توان برشمرد. از این رو جهت بالابردن توان مدل با اعمال روش هایی می توان روش های اولیه را بهبود بخشید. مشاهده می شود که روش بسامدشماری بهبود یافته در پیکره اختصاصی از سایر روش ها عملکرد بهتری داشته و تا ۶۰ درصد واژگان تخصصی را در ۵۰ واژه پر بسامد شناسایی می نماید. از سوی دیگر مشاهده می گردد که با افزایش دامنه واژگان مورد بررسی در پژوهش از ۵۰ به ۱۰۰، ۱۵۰ و ۲۰۰ دقت مدل ها افزایش یافته و درصد واژگان تخصصی انتخاب شده به ثبات می رسد.
۱۲.

ارتقا و اصلاح فرایندهای رایج در بازشناسی نوری حروف متون فارسی با به کارگیری ویژگی های خط فارسی و الگوریتم انتقال فضا(مقاله علمی وزارت علوم)

تعداد بازدید : 421 تعداد دانلود : 589
از آنجا که فن آوری بازشناسی نوری حروف اصالتاً بر پایه ویژگی های خطی لاتین بنا شده است، تقریباً کلیه الگوریتم ها و مراحل مورد استفاده در نظام های رایج بازشناسی حروف فارسی نیز بر اساس همان ساختار و ویژگی های خطوط لاتین گسترش یافته اند. بکارگیری ابزار و ویژگی های خطوط لاتین در طراحی نظام های فارسی محور، نه تنها در نهایت به انجام بازشناسی صحیح حروف فارسی منجر نگردیده است، بلکه باعث سردرگمی همزمان نرم افزار و کاربر فارسی زبان نیز شده است. از اینرو، در اینجا، پس از مقدمه ای کوتاه پیرامون اهمیت خط و زبان در حوزه فن آوری اطلاعات به سیر تحول خط فارسی در دوره های مختلف و شرح ویژگی های این خط و تفاوت های آن با خطوط دیگر پرداخته شده است و عناصر شکلی این خط، با توجه به کاربرد و اهمیت آنها در تعامل کاربر با نرم افزارهای بازشناسی نوری متون فارسی، طیقه بندی گردیده است. در این بخش، با توصیف و تحلیل مراحل بازشناسی حروف بر اساس ویژگی های خط فارسی و شرح تفاوتهای آن با گونه های لاتین محور موجود، چهره ای متفاوت از دستگاه خط فارسی به هنگام کار با رایانه ها و به ویژه در سیستم های بازشناسی نوری حروف عرضه می شود بطوری که مخاطب عملاً قابلیت و ظرفیت های دستگاه خط فارسی در هماوردی با دستگاه ساده خط لاتین را مشاهده خواهد نمود. با اتکا به همین ویژگی ها، در جهت ارتقاء و اصلاح الگوریتم های رایج در بازشناسی نوری حروف فارسی، تسهیل بکارگیری الگوها، و تعدیل حجم پایگاه داده ها، از فرایند انتقال هندسی فضای دو بعدی به تک بعدی نیز بهره جسته ایم.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان