زهره هنرجویان

زهره هنرجویان

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۴ مورد از کل ۴ مورد.
۱.

بررسی تازگی اطلاعات فارسی: مطالعه موردی روزنامه های فارسی نمایه شده در پایگاه های گوگل، یاهو و بینگ(مقاله علمی وزارت علوم)

کلید واژه ها: گوگل یاهو روزنامه فارسی بینگ نرخ تازگی سرعت روزآمدسازی روزآمدسازی بی درنگ

حوزه های تخصصی:
  1. حوزه‌های تخصصی علوم کتابداری کتابخانه ها مجموعه های کتابخانه ای و منابع کتابخانه ای و اطلاعاتی انواع منابع اطلاعاتی روزنامه ها
  2. حوزه‌های تخصصی علوم کتابداری علوم اطلاع رسانی اینترنت و موتورهای کاوش
  3. حوزه‌های تخصصی علوم کتابداری علوم کتابداری نمایه سازی و چکیده نویسی اصطلاح نامه ها و هستی شناسی ها
تعداد بازدید : ۱۸۶۲ تعداد دانلود : ۱۰۴۱
پژوهش حاضر که به هدف بررسی تازگی اطلاعات فارسی انجام شده است، می کوشد تا سرعت نمایه سازی روزنامه های فارسی را در سه موتور کاوش گوگل، یاهو و بینگ مطالعه و مقایسه کند. این پژوهش به روش وب سنجی انجام شده و جامعه آن را کلیه روزنامه های فارسی پیوسته تشکیل می دهد. نمونه پژوهش به روش هدفمند شناسایی شد و شامل آن دسته از روزنامه های فارسی زبان بود که فهرست آن ها در پایگاه «مگ ایران» آمده و نسخه الکترونیکی آن ها به طور منظم بر وب سایت مربوطه منتشر می شود. نتایج حاصل از پژوهش نشان داد موتور کاوش گوگل به لحاظ سرعت روزآمدسازی روزنامه های فارسی رتبه بالاتری نسبت به موتورهای کاوش یاهو و بینگ دارد. علاوه بر این، گوگل به طور کلی از الگوی روزآمدسازی منظم تری پیروی می کند. دو موتور کاوش یاهو و بینگ نه تنها از سرعت کمتری نسبت به گوگل برخوردارند، بلکه الگوی روزآمدسازی نامنظم تری دارند. دو موتور کاوش یاهو و بینگ به لحاظ سرعت روزآمدسازی تفاوتی با یکدیگر ندارند. این پژوهش برای نخستین بار وضعیت نمایه سازی روزنامه های فارسی زبان را در موتورهای کاوش وب مورد بررسی قرار داد و نشان داد که جستجوگرانی که به کمک موتورهای کاوش به این روزنامه ها دست می یابند، در گوگل از بخت بالاتری برای دستیابی به نسخه روزآمد این روزنامه ها برخوردارند.
۲.

معناشناسی در سامانه های برچسب گذاری اجتماعی: یک مرور نظام مند(مقاله علمی وزارت علوم)

تعداد بازدید : ۴۴۵ تعداد دانلود : ۴۶۷
هدف: مرور نظام مند پژوهش های حوزه معناشناسی در سامانه های برچسب گذاری اجتماعی، به منظور شناسایی شاخه های موضوعی قابل توجه پژوهشگران، مرور راهکارهای رفع یا کاهش اثرات مسائل معناشناسی بر بازیابی اطلاعات در این سامانه ها و شناسایی شکاف های پژوهشی این حوزه است. روش پژوهش : پژوهش به روش مرور نظام مند انجام گرفته است. به این منظور، با جستجو در پایگاه های اطلاعاتی، 101 مقاله پژوهشی به زبان انگلیسی در بازه زمانی 2003-2019 انتخاب و پس از پالایش، 44 پژوهش تحلیل شد. یافته ها: محورهای موضوعی مهم شامل طراحی یک سامانه برچسب گذاری معنایی، استفاده از وردنت برای تعیین رابطه معنایی میان برچسب ها، بهره گیری از بافت برای ابهام زدایی از معنای برچسب، تولید الگوریتم برچسب گذاری معنایی خودکار بودند. خلأهای پژوهشی برای انجام پژوهش های آتی عبارتند از: ابداع روشی برای شناسایی منابع حاوی معنایی خاص از یک برچسب بدون نیاز به بررسی همه منابع، بررسی امکان استفاده از روش های خوشه بندی برچسب ها برای خوشه بندی منابع. نتیجه گیری: با توجه به شکاف های پژوهشی همچنان مسئله معنا در سامانه های برچسب گذاری می تواند از حوزه های مهم مطالعات پژوهشی سازماندهی اطلاعات باشد.
۳.

مروری بر دشواریهای زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۸۱ تعداد دانلود : ۱۰۸
هدفهای پژوهش: زبان فارسی، به سبب ویژگیهای خاصّ آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواریهایی روبه روست که تأثیری بسزا بر اثربخشی بازیابی اطلاعات می گذارد. پژوهش حاضر می کوشد تا با بررسی متون و پیشینه های موجود، چالشهای نگارش فارسی، تأثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهاد های ارائه شده در جهت رفع این دشواریها را مورد بحث و بررسی قرار دهد. اهمیت پژوهش: با تحلیل و مرور جامع متونی که درباره چالشهای نگارش فارسی در محیطهای دیجیتال نگارش یافته است، می توان دانشی را که تاکنون در این باره گرد آمده است به تصویر کشید و کاستیها و پیشرفتهای به دست آمده در این زمینه را آشکار ساخت. روش پژوهش: روش پژوهش حاضر، متن پژوهی با رویکرد تحلیل محتواست که از روشهای پژوهش کیفی به شمار می آید. «پاراگراف»، «جمله» و «کلمه» به عنوان واحد تحلیل انتخاب شد، زیرا ممکن بود هر دشواری یا راهکار تنها در یک کلمه یا عبارت مورد اشاره قرار گرفته یا در جمله یا پاراگراف شرح داده شده باشد. یافته ها: آثار مورد بررسی، بیش از ۴۰ دشواری نگارشی را در رابطه با جستجو و بازیابی اطلاعات فارسی ذکر کرده اند. این گونه گونی نگارشی به نایکدستی و تطور بسیار در نگارش فارسی می انجامد که می تواند اثربخشی بازیابی را بویژه از منظر کاهش دقت یا ریزش کاذب و نیز کاهش جامعیت بازیابی، متأثر سازد. در نتیجه، ضروری است در طراحی الگوریتمهای سامانه های جستجو و بازیابی فارسی، به هنجارسازی تنوعات و چنددستیهای نگارشی و دستوری مد نظر قرار گیرد. تدوین استاندارد نگارش فارسی، استفاده از سیاهه های از پیش تعیین شده، تجهیز پایگاه اطلاعاتی به اصطلاحنامه و فرهنگهای املایی، و تدوین دستنامه یا راهنمای جستجو، از جمله راهکارهای ارائه شده است. این راهکارها با وجود جامع نبودن، کم و بیش اثربخش به نظر می رسند. نتیجه گیری: از آنجا که راهکارهای انسانی، نیازمند مشارکت فعّالانه و آموزش نویسندگان متون (تایپیستها و کاربران) است و از روندی بلندمدت و هزینه بر برخوردار است، حرکت به سوی راهکارهای خودکارسازی پردازش متن و نمایه سازی، ضروری است.
۴.

بررسی تنوع الگوهای نگارش فارسی و تاثیر آن بر جامعیت بازیابی اطلاعات : مطالعه موردی : پیکره همشهری(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۵۹ تعداد دانلود : ۱۵۴
در الگوهای نگارش می تواند بر اثربخشی بازیابی اطلاعات فارسی تأثیر منفی داشته باشد. آشکار است که تلاش در جهت لحاظ کردن همه الگوها در الگوریتم های بازیابی اطلاعات فارسی، بر پیچیدگی آنها می افزاید و کارآیی سامانه های بازیابی اطلاعات را کاهش می دهد. از این رو، ضروری است با بررسی رفتارهای نگارندگان فارسی، میزان چندگانگی الگوها و تأثیر آن بر بازیابی اطلاعات در عمل و در نتیجه، ضرورت لحاظ کردن آنها در الگوریتم های فارسی آشکار گردد. روش پژوهش : در پژوهش حاضر که به روش تحلیل محتوای مفهومی انجام گرفته است، 7 چالش از میان 43 چالش نگارشی که با مرور ادبیات مربوط، شناسایی شده بود انتخاب گردید و پس از محاسبه تنوع و فراوانی رویداد آنها در متون پیکره همشهری، میزان انطباق شیوه نگارش آنها با دستور خط مصوب فرهنگستان زبان و ادب فارسی بررسی شد. یافته ها : نتایج پژوهش نشان داد نگارندگان متون پیکره به طور کلی تمایل به حذف یا جایگزینی نویسه های چالشی دارند. بنابراین، به نظر می رسد دست کم درباره هفت چالش مورد بررسی در این پژوهش، با نادیده گرفتن این چالش ها در سامانه های بازیابی اطلاعات، اثربخشی بازیابی چندان متأثر نمی شود. مقدار کلی شاخص«ضریب درگیری» برابر با 033/0 به دست آمد که بیانگر انطباق نداشتن گسترده الگوی نگارشی نگارندگان با دستور خط مصوب فرهنگستان است. از دلایل این امر می توان به تمایل نگارندگان به ساده نگاری در اثر «اصل کمترین کوشش» و عدم احساس ضرورت رعایت رسم الخط مرسوم عربی توصیه شده در دستور خط مصوب فرهنگستان، اشاره کرد.  

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان