آرشیو

آرشیو شماره ها:
۸۱

چکیده

در الگوهای نگارش می تواند بر اثربخشی بازیابی اطلاعات فارسی تأثیر منفی داشته باشد. آشکار است که تلاش در جهت لحاظ کردن همه الگوها در الگوریتم های بازیابی اطلاعات فارسی، بر پیچیدگی آنها می افزاید و کارآیی سامانه های بازیابی اطلاعات را کاهش می دهد. از این رو، ضروری است با بررسی رفتارهای نگارندگان فارسی، میزان چندگانگی الگوها و تأثیر آن بر بازیابی اطلاعات در عمل و در نتیجه، ضرورت لحاظ کردن آنها در الگوریتم های فارسی آشکار گردد. روش پژوهش : در پژوهش حاضر که به روش تحلیل محتوای مفهومی انجام گرفته است، 7 چالش از میان 43 چالش نگارشی که با مرور ادبیات مربوط، شناسایی شده بود انتخاب گردید و پس از محاسبه تنوع و فراوانی رویداد آنها در متون پیکره همشهری، میزان انطباق شیوه نگارش آنها با دستور خط مصوب فرهنگستان زبان و ادب فارسی بررسی شد. یافته ها : نتایج پژوهش نشان داد نگارندگان متون پیکره به طور کلی تمایل به حذف یا جایگزینی نویسه های چالشی دارند. بنابراین، به نظر می رسد دست کم درباره هفت چالش مورد بررسی در این پژوهش، با نادیده گرفتن این چالش ها در سامانه های بازیابی اطلاعات، اثربخشی بازیابی چندان متأثر نمی شود. مقدار کلی شاخص«ضریب درگیری» برابر با 033/0 به دست آمد که بیانگر انطباق نداشتن گسترده الگوی نگارشی نگارندگان با دستور خط مصوب فرهنگستان است. از دلایل این امر می توان به تمایل نگارندگان به ساده نگاری در اثر «اصل کمترین کوشش» و عدم احساس ضرورت رعایت رسم الخط مرسوم عربی توصیه شده در دستور خط مصوب فرهنگستان، اشاره کرد.