شناسایی چالش های برگردان اسامی فارسی به انگلیسی در پایگاه وب آو ساینس(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هدف پژوهش حاضر، شناخت چالش های برگردان نام های فارسی به انگلیسی و فراوانی این چالشها در پایگاه وب آف ساینس است. این پژوهش به لحاظ هدف کاربردی و از نظر نحوه گردآوری داده ها کمی از نوع پیمایشی است. جامعه ی پژوهش شامل نام های نویسندگان ایرانی در پایگاه وب آف ساینس می باشد که در بازه ی زمانی هفت ساله ی 2010 تا 2017 مقاله ی انگلیسی نگاشته اند. تعداد 3110873 نام در ابتدا بازیابی شد که پس از پالایش و یکدست سازی اسامی به 11242 نام تقلیل یافت. به منظور پالایش، آماده سازی و تحلیل داده ها از نرم افزار بیب اکسل، اکسل و پایگاه وب آف ساینس استفاده شد. یافته های پژوهش نشان داد در برگردان نام ها از فارسی به انگلیسی چهار گروه چالش های مربوط به "همخوان ها"، چالش های مربوط به "واکه ها" ، چالش های مربوط به "حذف یا تکرار حروف" و چالش های "تلفظی" وجود دارد. در دسته ی اول، چالش های همخوان ها، نویسندگان و نگارندگان در برگردان نام ها در یازده حرف (8 واج)، شامل حروف ق، غ، ژ، ع، و، ک، ج، ک، ث، س، ص، صورت های مختلف نگارشی داشته اند. در دسته ی دوم (چالش واکه ها)، صورت های نگارشی مختلفی در برگردان واکه های (/ i / ، / u /، توالی واج های / e / و / j / ،/ o / ) و پایانه ( ِه) از فارسی به انگلیسی مشاهده شد. در دسته ی سوم، وجود حروف مشدد و حروف (ال) در برخی نام ها موجب به وجود آمدن چندگانگی در نگارش نام ها شده است . و در نهایت در در دسته آخر، آواهای اَ و اِ، و همچنین حذف برخی حروف به علت تفاوت در تلفظ نام ها در گویش ها و زبان های مختلف دچار چندگانگی شده اند. با توجه به اهمیت بازیابی اسامی در جستجوی نویسندگان و همچنین در ارزیابی پژوهش، راهکارهایی همچون استفاده از عملگر های بولی و نویسه جایگزین بین صورت های نگارشی غالب، ایجاد ساندکس زبان فارسی، مجهز کردن پایگاه به ابزارهای دانشی ویژه نام ، جهت یکدستی در برگردان نام ها ضرورت دارد.