هاجر ستوده

هاجر ستوده

مدرک تحصیلی: دانشیار گروه علم اطلاعات و دانش شناسی، دانشگاه شیراز

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۲۱ تا ۴۰ مورد از کل ۴۸ مورد.
۲۱.

بررسی نقش انواع بافتار هم نویسه ها در تعیین شباهت بین مدارک(مقاله علمی وزارت علوم)

کلید واژه ها: همنویسه شباهت معنایی بافتار عنوان بافتار عنوان ارجاع بافتار استنادی متنی بافتار متن تحلیل تشخیصی

حوزه های تخصصی:
تعداد بازدید : ۸۴۵ تعداد دانلود : ۴۸۳
رفع ابهام معنایی واژگان در بازیابی خودکار اطلاعات از چالش های بزرگ این حوزه است. متن در خود عناصری محتوایی یا ساختاری دارد که با شناسایی و تحلیل آن ها و استخراج الگوهای متفاوت می توان به رفع ابهام معنایی و در نتیجه، افزایش اثربخشی نتایج بازیابی دست یافت. هم نویسه ها از جمله واژگانی هستند که به رفع ابهام معنایی نیاز دارند. نشان داده شده است که بافتار هم نویسه می تواند به بهبود بازیابی آن کمک کند. بافتار هم نویسه خود می تواند بسته به نقش و جایگاه آن در متن به انواعی تقسیم شود که ممکن است هر یک در تعیین شباهت بین مدارک از قدرت متفاوتی برخوردار باشد. هدف اصلی از این پژوهش، مقایسه پنج نوع بافتار متنی (شامل بافتار استناد متنی، ارجاع، عنوان ارجاع، عنوان و متن مقاله) به لحاظ قدرت آن ها در تعیین شباهت میان مدارک است. به کمک روش تحلیل متن، مجموعه ای آزمایشی از مدارک پیرامون هم نویسه های انگلیسی مشتمل بر 3637 مقاله منتشرشده در بازه زمانی 2000-2015 پیرامون 19 هم نویسه در 54 گروه موضوعی مورد بررسی قرار گرفت. برای تعیین شباهت درون خوشه ها از روش آماری تحلیل تشخیصی استفاده شده است. نتایج تحلیل تشخیصی نشان داد که در درون خوشه های معنایی، زیرخوشه هایی با تمایز بسیار اندک قابل مشاهده است. دو بافتار استناد متنی و ارجاع کمترین نقش را در ایجاد تمایز و در نتیجه، بیشترین شباهت را در درون خوشه ها داشته اند. نتایج به دست آمده نشان داد که هم معنا بودن هم نویسه ها به ایجاد خوشه هایی از مدارک منجر می شود که در درون آن ها مدارک با هم به لحاظ انواع بافتار هم نویسه ای تفاوت چندانی با هم ندارند. همچنین،انواع بافتار از قدرت برابری در تعیین تشابه بین مدارک برخوردار نیستند. دو بافتار استناد متنی و ارجاع در تعیین شباهت معنایی در درون خوشه های معنایی بیشترین قوت را داشته اند. از این دو نوع بافتار که قوت بیشتری در ایجاد شباهت داشته اند، می توان برای بهبود نتایج بازیابی کمک گرفت. الگوریتم های بازیابی در موتورهای جست وجو و پایگاه های اطلاعاتی می توانند برای سنجش دقیق تر شباهت بین مدارک حاوی هم نویسه ها از تحلیل این دو نوع بافتار استفاده کنند. اثر حاضر نخستین پژوهشی است که به تعریف انواع گوناگونی از بافتارهای متنی و مقایسه آن ها به منظور تعیین قدرت آن ها در سنجش شباهت مدارک حاوی هم نویسه های هم معنا می پردازد.
۲۲.

مقایسه رفتار و راهبردهای مرور کاربران دارای سبک های شناختی کلامی- دوسویه-تصویری در تعامل با وب(مقاله علمی وزارت علوم)

کلید واژه ها: جستجوی مروری رفتار کاربران سبک های شناختی تجربه جستجو سبک کلامی - تصویری

حوزه های تخصصی:
تعداد بازدید : ۶۸۹ تعداد دانلود : ۴۱۶
هدف: مقایسه رفتار و راهبردهای مرور کاربران با سبک های شناختی متفاوت. روش شناسی:پیمایش حاضر با رویکرد مقایسه ای انجام شده است. نمونه، 90 دانشجوی کارشناسی داوطلب بود. از پرسشنامه پژوهشگرساخته برای گردآوری اطلاعات جمعیت شناختی و سنجش تجربه و از آزمون رایدینگ برای تعیین سبک شناختی آزمودنی ها استفاده شد. هر آزمودنی سه وظیفه را در دو وب سایت انجام داد و همه تعاملات ثبت و ذخیره شد. یافته ها: از نظر رفتار مرور، کاربران مبتدی از دکمه برگشت بیشتر و تعداد پنجره های کمتری استفاده می کنند. بین کاربران کلامی- تصویری در رفتار جستجو تفاوتی وجود ندارد. اما سبک شناختی و تجربه کاربران بر استفاده از دکمه برگشت تأثیر داشته است. از نظر راهبرد مرور، کاربران باتجربه ساختاریافته تر جستجو می کنند. بین کاربران با سبک شناختی کلامی- تصویری تفاوتی در سبک مرور وجود ندارد. تعامل سبک شناختی و تجربه کاربران بر راهبرد مرور تأثیر دارد و کاربران مبتدی دارای سبک تصویری پراکنده تر و کاربران باتجربه دارای سبک تصویری ساختاریافته تر از دیگران  مرور می کنند. نتیجه گیری: توجه به رفتار و راهبردهای جستجو می تواند به ارائه ابزارهای پشتیبانی و ارتقای سطح تجربه کاربران کمک کند. بدین منظور می توان از دوره های آموزش سواد اطلاعاتی استفاده کرد و سامانه های تعاملی و چندرسانه ای ارائه نمود. 
۲۳.

مطالعه نفوذ مقالات علمی در متون اجتماعی با تحلیل شباهت واژگانی و شاخص های دگرسنجی در قلمرو موضوعی تغییرات آب و هوا(مقاله علمی وزارت علوم)

کلید واژه ها: نفوذ علمی شباهت واژگانی شاخص دربرداردگی آلتمتریک استناد

حوزه های تخصصی:
تعداد بازدید : ۶۲۶ تعداد دانلود : ۴۵۹
مسئله پژوهش حاضر، مطالعه متون علمی و متون اجتماعی نظیر آنها، با هدف بررسی نفوذ استنادی و نفوذ اصطلاحات متون علمی در متون اجتماعی است. انتظار می رود، متن اجتماعی به وسیله استناد به متون علمی پلی باشد بین دانشمندان و کاربران فضای اجتماعی تا بتوان به کمک پردازش واژگان هر یک از متون علمی و اجتماعی و سنجش شباهت آنها به کمک شاخص دربردارندگی، میزان نفوذ واژگانی یا نفوذ علم در اجتماع را، مشاهده نمود. اساس داده های آماری پژوهش حاضر را، مقالات علمی حوزه موضوعی تغییرات آب و هوا منتشر شده در مجلات تحت پوشش پایگاه وب علوم تشکیل می دهد، که نقش جامعه پژوهش را دارند. اعضای نمونه شامل 9876 متن علمی و اجتماعی (7912 متن اجتماعی استناد کننده به 1964 متن علمی) که به کمک کد پایتون و بسته سوپ زیبا از محیط وب، استخراج و در قالب فایل های .txt ذخیره گردید. فایل های pdf به صورت دستی استخراج و به فایل txt تبدیل شدند. با استفاده از مدل نمایه سازی خودکار شکاف و زبان عبارات الگودار، اصطلاحات نمایه سازی شده متون علمی و اجتماعی و اصطلاحات مشترک میان آنها، مشخص و بر اساس طول آنها و به تفکیک نوع مدارک اجتماعی، دسته بندی شدند. سنجش میزان نفوذ با استفاده از شاخص دربردارندگی، نشان داد که میانگین شدت نفوذ برابر با 27 درصد است. همبستگی مثبت، معنادار و قوی (76/0) بین تعداد اصطلاحات مشترک و شدت نفوذ علمی وجود دارد. نتایج آزمون مجذور کا نیز، نشان داد که رابطه معناداری در سطح 1% بین تعداد واژگان اصطلاح (طول اصطلاح) و شدت نفوذ، وجود دارد. همچنین بین سطح شدت نفوذ و نوع مدارک اجتماعی اعم از خبر، وبلاگ، اسناد سیاست گذاری، ویکی پدیا و متن داوری ها، تفاوت وجود دارد. بیشترین درصد نفوذپذیری مربوط به اسناد سیاست گذاری و سپس ویکی پدیا است. کسب 22 استناد علمی و 40 استناد اجتماعی به طور میانگین برای هر مقاله، و همبستگی قوی میان استناد و نمره آلتمتریک، نشان دهنده نفوذ استنادی مقالات در میان جامعه دانشگاهی و غیردانشگاهی است. در مجموع می توان از قدرت دگرسنجه هایی چون اسناد سیاست گذاری، ویکی پدیا و وبلاگ ها و نفوذپذیری واژگانی آنها، جهت ترویج هرچه بیشتر و بهتر یافته های علمی استفاده نمود و با نشر علم در این منابع حتی با زبانی متفاوت از زبان نگارش نویسندگان، به آگاهی بیشتر جامعه و عموم مردم، کمک نمود.
۲۴.

همبستگی میان شاخص های اثرگذاری پژوهشی: تحلیل عاملی شاخص های دگرسنجی و استناد(مقاله علمی وزارت علوم)

کلید واژه ها: آلتمتریکس دگرسنجه ها تحلیل استنادی تاثیر پژوهش شبکه های اجتماعی

حوزه های تخصصی:
تعداد بازدید : ۶۰۸ تعداد دانلود : ۳۹۹
هدف: بررسی اشتراک ساختاری دگرسنجه ها و استناد، درک و شناسایی سنجه های مشابه و ابعاد مختلف اثرگذاری آنها، و دسته بندی تجربی انواع دگرسنجه ها از طریق تفسیر و ترکیب منطقی شاخص ها. روش شناسی: نمونه ای هدفمند از مقالات مجلات زیرمجموعه کتابخانه عمومی علم (پلاس) منتشرشده در سال های 2010 تا 2012 به روش تحلیل استنادی مطالعه و از روش تحلیل عاملی برای شناسایی اشتراک ساختاری میان سنجه های مختلف و دسته بندی آنها استفاده شد. یافته ها: نتایج تحلیل عاملی به استخراج مدلی متشکل از 3 گروه عاملی منجر شد که درمجموع، قادر به پیش بینی حدود 53 درصد از واریانس متغیر مکنون، یعنی «تأثیر بروندادهای پژوهشی» است. به نظر می رسد مدل تجربی به دست آمده با مدل نظری پیشنهادی «جانپینگ و هوکیانگ» انطباق دارد. نتایج نشان می دهد نوع تأثیر، گستره، و عمق آن در سه گروه شناسایی شده، متفاوت است. گروه نخست، «تأثیر در سطح دریافت»، گسترده ترین و در عین حال، کم عمق ترین تأثیر را نشان می دهد. این سطح را بیشتر می توان سطح «مصرف» نامید که لزوماً به «استفاده» منجر نمی شود. در نقطه ای دیگر از این پیوستار تأثیر، سطح «تأثیر در سطح رسانه های اجتماعی» قرار دارد که بعد از مصرف، سطحی بالاتر از تعامل با متن را بازنمون می کند. این سطح به لحاظ گستره افراد، محدودتر؛ اما به لحاظ عمق تأثیر، قوی تر از سطح پیشین است. در قطب دیگر این پیوستار، «تأثیر در سطح کاربرد» قرار دارد که پس از مطالعه و تعامل عمیق تر با متن و گزینش آگاهانه آن روی می دهد. نتیجه گیری: یافته های پژوهش نشان دهنده توانمندی دگرسنجه ها در سنجش انواع اثرگذاری در گستره و عمق های متفاوت است. این نتایج می تواند از طریق شناسایی سرشت تأثیراتی که شاخص ها بازنمایی می کنند، شناخت روابط میان آنها، و غلبه بر تعدد و آشفتگی آنها در افزایش دقت ارزیابی پژوهش مؤثر واقع شود.
۲۵.

استخراج کلمات و عبارات کلیدی از متون فارسی(مروری بر پژوهش های صورت گرفته)(مقاله علمی وزارت علوم)

کلید واژه ها: استخراج کلمات کلیدی استخراج عبارات کلیدی پردازش زبان طبیعی زبان فارسی بررسی مروری

حوزه های تخصصی:
تعداد بازدید : ۵۴۳ تعداد دانلود : ۴۳۶
استخراج کلمات/ عبارات کلیدی متن، پیش نیاز بسیاری دیگر از وظایف حوزه پردازش زبان طبیعی است. اما بررسی متون فارسی و انگلیسی این حوزه نشان می دهد، تلاش های انگشت شماری برای استخراج کلمات/ عبارات کلیدی از متون فارسی صورت گرفته است. لذا، این مقاله، با هدف تعیین موقعیت کنونی پردازش زبان طبیعی فارسی و به طور خاص استخراج کلمات/ عبارات کلیدی از متون فارسی، به مرور خلاصه ای از مقالات فارسی و انگلیسی منتشر شده در این حوزه که از متون فارسی برای آزمودن ایده هایشان استفاده کرده اند ، می پردازد؛ سپس هر مقاله را از نظر روش شناسی، نحوه اجرا و پیاده سا زی، روش ارزیابی و معیارهای آن مورد تعمق قرار داده و به چالش می کشد . در مجموع 14 مقاله فارسی و 6 مقاله انگلیسی به استخراج کلمات و عبارات کلیدی از متون فارسی پرداخته اند . روش بیشتر این مقالات، استفاده از اطلاعات آماری و زبان شناختی بوده است. اکثر این مقالات یا در روش شناسی انتخاب شده ایراد دارند و یا نویسندگان نتوانسته اند ایده پیشنهادی شان را به وضوح برای خواننده تبیین نمایند. در بسیاری از مقالات، از مجموعه داده استانداردی برای ارزیابی سیستم استفاده نشده و نحوه محاسبه معیارهای ارزیابی مبهم یا دارای اشکال است . در مجموع، به جز 3 مقاله که روش اجرا شده را به نحو نسبتاً قابل قبولی گزارش کرده اند ، سایر مقالات قابلیت تکرار پذیری و تعمیم ندارند. لذا نمی توان از آن ها به عنوان معیار پایه ای برای ارزیابی سیستم های آینده استفاده کرد یا از ایده مطرح شده در آن ها با اطمینان در ساخت و توسعه نرم افزارهای کاربردی و عملی در حوزه استخراج کلمات کلیدی استفاده نمود .
۲۶.

خودکارسازی پیشنهاد داور برای دست نوشته ها: مرور نظام مند متون پژوهشی(مقاله علمی وزارت علوم)

کلید واژه ها: پیشنهاد داور سامانۀ خبره یابی مرور نظام مند

حوزه های تخصصی:
تعداد بازدید : ۵۳۸ تعداد دانلود : ۳۹۳
هدف: در این پژوهش با مرور نظام مند پژوهش های حوزۀ خودکارسازی پیشنهاد داور برای مقالات در سامانۀ مجلات علمی به شناسایی وضعیت پژوهش های این حوزه ازنظر انواع شواهد خبرگی، انواع مدل های بازیابی مورداستفاده، شکاف پژوهشی موجود پرداخته شده، و درپایان پیشنهادهایی برای پژوهش های آتی ارائه شده است. روش : در پژوهش حاضر، از چارچوب مطالعۀ نظام مند کیچن هام و چارترز (2007) استفاده شده است. جستجو در پایگاه های اطلاعات علمی فارسی و انگلیسی با کلیدواژه های مرتبط انجام و تعداد 50 منبع به زبان انگلیسی در بازۀ زمانی 1992 تا 2018 یافت شد. پس از اعمال پالایش اولیۀ معیارهای ورود و خروج از مطالعه و کنترل توسط متخصصان، تعداد 43 منبع انگلیسی برای ورود به مرور نظام مند انتخاب شدند. سپس با طراحی کاربرگی، استخراج اطلاعات از منابع صورت گرفت. یافته ها: مرور پژوهش ها نشان داد شواهد خبرگی نامزد در مطالعات حوزۀ خودکارسازی پیشنهاد داور برای مقالات ، شامل چهار منبع «اطلاعات خود-توصیفی نامزد داوری» (5 پژوهش)، «مستندات ایجادشده توسط نامزد داوری» (26 پژوهش)، «شبکه های همکاری و روابط علمی نامزد داوری» (2 پژوهش)، و «منابع ترکیبی» (7 پژوهش) هستند و روش روابط علمی و منابع ترکیبی نسبت به دو روش دیگر متأخرتر هستند. همچنین، مدل های بازیابی اطلاعات مورداستفاده در سامانه های خبره یابی داور شامل مدل بولی، مدل بولی بسط یافته، مدل فازی، مدل برداری، مدل احتمالاتی، نمایه سازی معنای نهان، مدل تخصیص معنای نهان و مدل نویسنده- موضوع هستند. شکاف های پژوهشی موجود در این حوزه نیز «عدم توجه به طراحی سامانۀ خبره یابی داور در نشریات و کنفرانس های داخلی»، «عدم توجه به منابع دانشی» و «عدم توجه به دیدگاه کاربران در طراحی سامانه های موجود» است. اصالت/ارزش: با مرور پژوهش های حوزۀ خودکارسازی پیشنهاد داور، یافته های این حوزه ازنظر شواهد خبرگی داوری و مدل های به کاررفته دسته بندی و خلاصه شد. این پژوهش تصویری کلی نسبت به آنچه انجام شده و آنچه بهتر است در طراحی سامانه های بعدی درنظر گرفته شود به پژوهشگران ارائه می دهد.
۲۷.

بررسی میزان انطباق رفتار نگارشی نگارندگان و کاربران پایگاه های اطلاعات علمی فارسی با دستورالعمل های مصوب فرهنگستان زبان و ادب فارسی در ارتباط با پیوسته نویسی، نزدیک نویسی و جدانویسی کلمات(مقاله علمی وزارت علوم)

کلید واژه ها: پایگاه های اطلاعات علمی فارسی پیوسته نویسی جدانویسی خط فارسی رفتار نگارشی فرهنگستان زبان و ادب فارسی کاربران نگارندگان نزدیک نویسی

حوزه های تخصصی:
تعداد بازدید : ۵۲۴ تعداد دانلود : ۴۷۲
هدف: هدف کلی پژوهش حاضر شناخت میزان انطباق رفتار نگارشی نگارندگان و کاربران پایگاه های اطلاعات علمی فارسی با دستورالعمل های مصوب فرهنگستان زبان و ادب فارسی از نظر پیوسته نویسی، نزدیک نویسی و جدانویسی کلمات است. روش شناسی: پژوهش حاضر از نظر هدف کاربردی و از نظر طرح تحقیق ارزیابانه است. جامعه پژوهش حاضر را دو گروه تشکیل می دهد، یکی مدارک موجود در سه پایگاه اطلاعات علمی فارسی یعنی مگیران، مرکز منطقه ای اطلاع رسانی علوم و فناوری و اس.آی.دی؛ و دیگری دانشجویان تحصیلات تکمیلی دانشگاه شیراز در سال تحصیلی (94-93). ابزار پژوهش شامل دو سیاهه وارسی محقق ساخته بود. هر سیاهه شامل 12 مصداق (کلیدواژه) از مجموع قواعد گزینش شده دستورالعمل های مصوب فرهنگستان زبان و ادب فارسی بود که امکان رخداد جدانویسی، نزدیک نویسی و پیوسته نویسی آن ها در هنگام نگارش وجود داشت. یافته ها : یافته های پژوهش نشان داد رفتار نگارشی کاربران تنها در 23/25 درصد از موارد منطبق با قواعد دهگانه دستورالعمل های مصوب فرهنگستان زبان و ادب فارسی بود؛ و در مقابل، 76/75 درصد از کاربران این قواعد را نادیده گرفته بودند. رفتار نگارشی نگارندگان در 40 درصد از موارد مغایر با قواعد دهگانه دستورالعمل های فرهنگستان زبان و ادب فارسی بود و در مقابل، 60 درصد از نگارندگان این قواعد را رعایت کرده بودند. از دیگر یافته های پژوهش این بود که باوجود آشنایی 62/6 درصد از کاربران با نحوه درج نیم فاصله از طریق صفحه کلید رایانه، درعمده قواعد دهگانه اغلب کاربران شکل نگارشی پیشنهادی فرهنگستان، یعنی نزدیک نویسی را رعایت نکرده بودند. اصالت/ارزش : به پشتوانه پژوهش حاضر و پژوهش های مشابه، فرهنگستان زبان و ادب فارسی می تواند ضمن آگاهی از سلیقه و گرایش نگارشی نگارندگان و کاربران محمل های الکترونیکی در زمان مواجهه با کلماتی که دارای چند شکل نگارشی هستند، نسبت به اولویت بخشی و سیاستگذاری جهت اصلاح یا بهبود دستورالعمل های نگارشی خط فارسی و در نتیجه محقق ساختن یک رسم الخط واحد و مورد پذیرش طیف گوناگون استفاده کنندگان گام بردارد.
۲۸.

بافتار استنادهای مقاله های علم اطلاعات(مقاله علمی وزارت علوم)

کلید واژه ها: طبقه بندی استناد تحلیل فراگفتار تحلیل بافتار استناد علم اطلاعات الگوی هایلند

حوزه های تخصصی:
تعداد بازدید : ۵۲۱ تعداد دانلود : ۴۵۲
هدف : شناسایی، طبقه بندی، و تحلیل بافتارهای استنادی مقالات علم اطلاعات و انواع استنادها با رویکرد فراگفتار هایلند. روش شناسی : این پژوهش در دو مرحله «شناسایی طبقه استناد» (Jurgens et al., 2016) و «تحلیل مبتنی بر فراگفتار کارکرد شناسایی شده» (Hyland, 2005) انجام شده است. 164 بافتار استنادی مقالات استناد کننده به 10 مقاله به زبان انگلیسی (مجموعاً شامل 656 جمله استنادی صریح و ضمنی) بررسی شده است. یافته ها : استنادها از نظر فراگفتار در 2 طبقه اصلی استناد های «تعاملی- هدایتی» و «تعاملی- مشارکتی» با 4 طبقه فرعی در سطح دوم، 14 طبقه فرعی تر در سطح سوم و 23 طبقه فرعی تر در سطح چهارم دسته بندی شد. استنادهای شناسایی شده بیشتر از نوع تعاملی- هدایتی بود و نه تعاملی- مشارکتی. طبقات درک شده نیز بیشتر توصیفی بودند و نه تحلیلی و نقدگونه. نتیجه گیری: شباهت طبقه بندی استنادهای این مطالعه با طرح های موجود تا سطح سوم است و اغلب نیز با طبقات استنادهای تعاملی- هدایتی اشتراکاتی دارند. به نظر می رسد انواع استنادهای تعاملی- مشارکتی شناسایی شده بتواند در پالایش بافتارهای استنادی در سامانه های بازیابی اطلاعات متون علمی و در ارزیابی کیفی تأثیرگذاری پژوهش ها یاری رسان باشد.
۲۹.

شناسایی چالش های برگردان اسامی فارسی به انگلیسی در پایگاه وب آو ساینس(مقاله علمی وزارت علوم)

کلید واژه ها: بازیابی اطلاعات پایگاه وب آوساینس برگردان انگلیسی به فارسی چالش های برگردان نام ها

حوزه های تخصصی:
تعداد بازدید : ۵۱۹ تعداد دانلود : ۴۴۹
هدف پژوهش حاضر، شناخت چالش های برگردان نام های فارسی به انگلیسی و فراوانی این چالشها در پایگاه وب آف ساینس است. این پژوهش به لحاظ هدف کاربردی و از نظر نحوه گردآوری داده ها کمی از نوع پیمایشی است. جامعه ی پژوهش شامل نام های نویسندگان ایرانی در پایگاه وب آف ساینس می باشد که در بازه ی زمانی هفت ساله ی 2010 تا 2017 مقاله ی انگلیسی نگاشته اند. تعداد 3110873 نام در ابتدا بازیابی شد که پس از پالایش و یکدست سازی اسامی به 11242 نام تقلیل یافت. به منظور پالایش، آماده سازی و تحلیل داده ها از نرم افزار بیب اکسل، اکسل و پایگاه وب آف ساینس استفاده شد. یافته های پژوهش نشان داد در برگردان نام ها از فارسی به انگلیسی چهار گروه چالش های مربوط به "همخوان ها"، چالش های مربوط به "واکه ها" ، چالش های مربوط به "حذف یا تکرار حروف" و چالش های "تلفظی" وجود دارد. در دسته ی اول، چالش های همخوان ها، نویسندگان و نگارندگان در برگردان نام ها در یازده حرف (8 واج)، شامل حروف ق، غ، ژ، ع، و، ک، ج، ک، ث، س، ص، صورت های مختلف نگارشی داشته اند. در دسته ی دوم (چالش واکه ها)، صورت های نگارشی مختلفی در برگردان واکه های (/ i / ، / u /، توالی واج های / e / و / j / ،/ o / ) و پایانه ( ِه) از فارسی به انگلیسی مشاهده شد. در دسته ی سوم، وجود حروف مشدد و حروف (ال) در برخی نام ها موجب به وجود آمدن چندگانگی در نگارش نام ها شده است . و در نهایت در در دسته آخر، آواهای اَ و اِ، و همچنین حذف برخی حروف به علت تفاوت در تلفظ نام ها در گویش ها و زبان های مختلف دچار چندگانگی شده اند. با توجه به اهمیت بازیابی اسامی در جستجوی نویسندگان و همچنین در ارزیابی پژوهش، راهکارهایی همچون استفاده از عملگر های بولی و نویسه جایگزین بین صورت های نگارشی غالب، ایجاد ساندکس زبان فارسی، مجهز کردن پایگاه به ابزارهای دانشی ویژه نام ، جهت یکدستی در برگردان نام ها ضرورت دارد.
۳۰.

سنجش شباهت نظرات داوری آزاد و محتوای مقالات علمی به روش پردازش زبان طبیعی(مقاله علمی وزارت علوم)

کلید واژه ها: نظرات کاربران داوری آزاد پردازش زبان طبیعی شباهت منحنی تحلیل عملکرد سامانه

حوزه های تخصصی:
تعداد بازدید : ۴۹۵ تعداد دانلود : ۵۴۰
هدف : شناسایی قابلیت داوری های آزاد در بازشناخت مقالات پزشکی براساس شباهت آنها به مقالات مربوط. روش شناسی: آزمونی متشکل از 2212 مقاله اف هزار ریسرچ و نظر ات داوری آنها ساخته شد. 100 مقاله به عنوان مدرک پایه به صورت تصادفی انتخاب شد. شباهت نظرات داوری و محتواهای مدارک براساس سنجه شباهت کسینوسی مقادیر <span lang="X-NONE" dir="LTR">TF-IDF در سطح تک واژه ها و دوواژه ها محاسبه شد. شباهت محتوا و نظرات با تحلیل همبستگی اسپیرمن تحلیل شد. صحت پیش بینی شباهت محتوای مقالات براساس شباهت نظرات دریافت شده به کمک منحنی مشخصه عملکرد سامانه آزمون شد. یافته ها : توان نظرات داوران در بازشناخت مقالات مشابه تأیید شد. میان محتوا و نظرات، همبستگی معنادار وجود دارد. منحنی های تحلیل عملکرد سامانه نیز نشان داد شباهت نظرات داوری، خواه در سطح تک واژه ها و خواه دوواژه ای ها توانایی شناسایی مقالات با محتوای مشابه را دارد. نتیجه گیری : اعتبار نظرات داوران ریشه در توان تخصصی و شناختی آنان دارد. بنابراین، نظرات می توانند در شبکه مدارک، در زمره منابع مرتبط اثربخش در بازشناخت مدارک به شمار آیند. این یافته راه را برای پژوهش در کاربرد نظرات کاربران در حوزه های بازیابی، ارزیابی، یا طبقه بندی متون هموار می کند که شباهت محتوایی در آنها اهمیت دارد.
۳۱.

تحلیل محتوا و تحلیل عقاید توییت ها درباره دسترسی آزاد و جنبه های مختلف آن(مقاله علمی وزارت علوم)

کلید واژه ها: دسترسی آزاد تحلیل احساس عقیده کاوی شبکه اجتماعی توییتر

حوزه های تخصصی:
تعداد بازدید : ۴۵۷ تعداد دانلود : ۲۲۰
پژوهش حاضر با هدف شناخت جنبه های دسترسی آزاد مورد توجه کاربران شبکه اجتماعی «توییتر» و تحلیل عقاید آنان در این باره انجام شد. نمونه ای از توییت های انگلیسی درباره دسترسی آزاد شناسایی و به روش تحلیل محتوای کمی با رویکرد تحلیل عقاید مطالعه شد. بدین منظور، نخست جنبه های مختلف دسترسی آزاد با مرور ادبیات حوزه شناسایی و در قالب فرمول های جست وجو تدوین شد. این گام به بازیابی ۸۷۴۲۷۰ توییت انجامید. داده ها با کمک جست وجوی انطباق دقیق در «اکسل» پاکسازی و نمونه ای مشتمل بر ۱۶۵۳۲۰ توییت مرتبط به دست آمد و سپس، نمونه به چهار گروه موضوعی «هزینه و منابع مالی»، «نشر و منابع»، «مدل ها» و «اعتبار و کیفیت» دسترسی آزاد دسته بندی شد. پردازش متن و محاسبه نمره عقیده توییت ها به ترتیب با نرم افزار «نایم» و «سنتی استرینگث» انجام شد. تحلیل داده ها با آمار توصیفی و استنباطی در «اکسل» و «اس پی اس اس» صورت گرفت. نتایج نشان داد که مفاهیم مرتبط با «نشر و انواع منابع دسترسی آزاد» از بیشترین توییت برخوردارند. چنانچه این گروه به دلیل کلیت و عمومیت آن نادیده گرفته شود، «اعتبار و کیفیت» و «هزینه ها و منابع مالی» دو موضوع اصلی مورد توجه کاربران «توییتر» است. بر اساس نتایح عقیده کاوی، بیش از نیمی از توییت ها خنثی بوده و فراوانی عقاید مثبت با اختلاف کمی از عقاید منفی بیشتر است. با این حال، دو موضوع «اعتبار و کیفیت» و «هزینه ها و منابع مالی» بیش از همه توییت های منفی گرفته اند. به این ترتیب، همسو با نتایج پیمایش های پیشین، که با هدف کشف دغدغه های محققان و ذی نفعان دسترسی آزاد انجام شده، پژوهش حاضر تصویری کم وبیش یکسان را برای فضای اجتماعی به دست داد. از آنجا که دسترسی آزاد به اطلاعات علمی در جهت توسعه جوامع دانش بنیان یک ضرورت محسوب می شود، نتایج تحقیق حاضر لزوم برداشتن گام هایی جدی برای تقویت نقاط مثبت و اندیشیدن راهکارهایی برای رفع مسائل و چالش هایی که به عقاید منفی منجر شده است، برجسته می سازد.
۳۲.

تفاوت عملکرد جستجوی مروری کاربران با سبک های شناختی و تجربیات متفاوت: نمونه پژوهی وب سایت های فروش کالا(مقاله علمی وزارت علوم)

کلید واژه ها: عملکرد جستجو سبک شناختی تصویری سبک شناختی کلامی جستجوی مروری تجربه کاربران وب سایت های فروش کال

حوزه های تخصصی:
تعداد بازدید : ۴۵۴ تعداد دانلود : ۷۸۰
هدف:شناخت تفاوت عملکرد جستجوی مروری کاربران با سبک های شناختی و تجربیات متفاوت در هنگام جستجو در وب سایت های فروش کالا. روش شناسی:پژوهش حاضر کاربردی است و از تحلیل محتوای کمّی برای استخراج داده های حاصل از تحلیل گزارش های تراکنش کاربران با محیط وب استفاده شده است. جامعه پژوهش کلیه دانشجویان کارشناسی دانشگاه شیراز و نمونه پژوهش شامل 90 دانشجوی کارشناسی داوطلب بود. یافته ها: در عملکرد کاربران باتجربه و مبتدی تفاوت معناداری وجود دارد؛ کاربران باتجربه در زمان کمتر، موفقیت بیشتری در انجام وظایف نسبت به کاربران مبتدی به دست آوردند. سبک شناختی کاربران تأثیری بر عملکرد آنها در جستجوی مروری نداشت، اما تعامل سبک شناختی و تجربه کاربران تفاوت هایی را در عملکرد آنها به وجود آورد؛ کاربران کلامی- مبتدی نسبت به کاربران کلامی- باتجربه زمان بیشتری را صرف انجام وظایف کردند. نتیجه گیری: کاربران کلامی- مبتدی در جستجوی مروری به کمک و توجه بیشتری نیاز دارند. بنابراین،  هنگام طراحی و آموزش سامانه های اطلاعاتی این مهم می بایست مد نظر قرار گیرد.
۳۳.

تأثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنال یاب رایسست: مطالعه موردی حوزه فنی و مهندسی(مقاله علمی وزارت علوم)

کلید واژه ها: اثربخشی سامانه پیشنهاددهنده نشریه کمبود داده پراکندگی داده سامانه ژورنال یاب رایسست

حوزه های تخصصی:
تعداد بازدید : ۴۱۷ تعداد دانلود : ۱۴۹
عوامل متعددی از مجموعه عناصر تشکیل دهنده سامانه های پیشنهاددهنده در تولید و ارائه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تاثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست انجام شده است. بدین منظور بیش از ۱۵۰۰۰ مقاله از نشریه های فنی و مهندسی در بازه زمانی ۱۳۹۲ تا ۱۳۹۶ از وب سایت نشریه ها گرداوری شد. در مرحله بعد عناصر متنی این مقاله ها شامل عنوان، چکیده و واژه های کلیدی استخراج، نرمال سازی و پردازش شد و پایگاه داده پیکره پژوهش ایجاد گردید. بر اساس تعداد مقاله های گردآوری شده، با استفاده از فرمول کوکران تعداد ۴۰۰ مقاله پایه که پیش از این در نشریه های مرتبط با موضوع منتشر شده بودند، به روش تصادفی- تناسبی، انتخاب شد. عنوان و چکیده این مقاله ها، به منظور دریافت نشریه های پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده به عنوان پرسمان وارد سامانه شد. سپس نتایج پیشنهادی در هر مرحله در قالب فایل اکسل ذخیره گردید. در نهایت میزان اثربخشی نتایج سامانه در هر مرحله، به روش اعتبارسنجی یک طرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی رده ها نشان داد در وضعیت موجود، نشریه هدف تنها در ۲۶ درصد از پرسمان ها در ۳ رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنی سازی، نرمال سازی و پردازش داده ها اثربخشی نتایج در ۳ رتبه نخست به میزان ۱۵ درصد افزایش یافت. اما همچنان در بیش از ۳۰ درصد پرسمان ها، نشریه هدف در رتبه ۱۰ و بالاتر پیشنهاد شده بود. بنابراین در مرحله بعد به منظور بهبود چالش پراکندگی، دسته بندی موضوعی داده ها انجام و افزایش ۳۰ درصدی اثربخشی نتایج نسبت به مرحله پیشین در ۳ رتبه نخست حاصل گردید. بر این اساس یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست می گردد، کمبود و پراکندگی داده ها است؛ که با غنی سازی پایگاه داده، بهبود فرآیند پردازش و دسته بندی موضوعی داده ها می توان به میزان قابل توجهی با این دو چالش مقابله و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.
۳۴.

شاخص ها و مدل هاى سنجش بهره ورى علمى پژوهشگران(مقاله علمی وزارت علوم)

تعداد بازدید : ۴۰۷ تعداد دانلود : ۲۱۳
افزایش تولید علم در سطح جهان، نیاز جدی به روش ها و ابزارهای دقیق و تا حد امکان عینی را برای سنجش بهره وری علمی پژوهشگران به منظور تضمین کیفیت عملکرد آنان پدید آورده است. روش ها و مدل های بسیاری در این زمینه ابداع شده که هریک تنها بخشی از واقعیت را منعکس می سازند. تعداد مقاله های علمی منتشرشده در مجلات علمی معتبر و شاخص ها و مدل های برگرفته از آن، عینی ترین و در عین حال آماده ترین ابزارهایی هستند که می توانند برای بازنمون بهره وری علمی و درنتیجه واحد سنجش آن به کار گرفته شوند. با این حال، این شاخص و مدل های مبتنی بر آن به تنهایی نمی توانند تصویری کامل را از بهره وری علمی، بازتاب دهند. نرخ و سرعت انتشار، از شاخص هایی هستند که با دخالت دادن عامل زمان در محاسبه تولید علم می توانند در سنجش دقیق تر بهره وری علمی به خدمت گرفته شوند. در پژوهش حاضر تلاش می شود برخی از مهم ترین شاخص ها و مدل های ارائه شده برای سنجش بهره وری علمی پژوهشگران مورد بررسی قرار گیرد.
۳۵.

بررسی تأثیر سطح پیچیدگی وظایف کاری بر عملکرد جستجوی مروری کاربران در تعامل با وب(مقاله علمی وزارت علوم)

کلید واژه ها: پیچیدگی وظیفه عملکرد جستجو جستجوی مروری وظیفه ساده وظیفه پیچیده

حوزه های تخصصی:
تعداد بازدید : ۳۹۰ تعداد دانلود : ۲۰۱
هدف: هدف از این پژوهش شناخت تأثیر سطح پیچیدگیِ عینیِ وظایف کاری بر عملکرد جستجوی مروری است. روش/رویکرد پژوهش: پژوهش حاضر از حیث هدف، کاربردی است و در آن برای گردآوری داده های مستخرج از فایل های تراکنش کاربران با وب، از تحلیل محتوای کمّی استفاده شده است. جامعه پژوهش شامل کلیه دانشجویان کارشناسی دانشگاه شیراز و نمونه مورد مطالعه شامل 90 دانشجوی کارشناسی دانشگاه شیراز است که سه وظیفه ساده، با پیچیدگی متوسط و کاملاً پیچیده را در دو وب سایت «دیجی کالا» و «زنبیل» از طریق جستجوی مروری انجام دادند. یافته ها: نتایج نشان داد سطح پیچیدگیِ وظایف بر عملکرد کاربران از نظر زمان و موفقیت، در جستجوی مروری تأثیر قابل توجهی دارد؛ به نحوی که کاربران مدت زمان کمتری را برای تکمیل وظیفه ساده در مقایسه با دو وظیفه با پیچیدگی متوسط و کاملا پیچیده، صرف کردند. همچنین کاربران در انجام وظیفه ساده نسبت به دو وظیفه با پیچیدگی متوسط و کاملاً پیچیده، موفق تر عمل کردند. نتیجه گیری: با آگاهی از عوامل مؤثر بر عملکرد جستجوی مروری کاربران همچون سطح پیچیدگیِ عینیِ وظایف، می توان جستجوی مروری کاربران در نظام های اطلاعاتی را بهبود بخشید. نتایج این پژوهش می تواند برای طراحان، توسعه دهندگان، کاربران و آموزش دهندگان نظام های اطلاعاتی برای شناخت عوامل مؤثر بر جستجوی مروری و کاهش اثر منفی و افزایش اثر مثبت آنها بر عملکرد کاربران، مفید باشد.    
۳۶.

بررسی عملکرد مرور دانشجویان در محیط وب برحسب تجربه و سطح کامل بودن مدل ذهنی(مقاله علمی وزارت علوم)

کلید واژه ها: مدل ذهنی سطح کامل بودن مدل ذهنی تجربه جستجوی مروری وب سایت فروش کالا

حوزه های تخصصی:
تعداد بازدید : ۳۴۱ تعداد دانلود : ۳۷۹
هدف : هدف پژوهش حاضر، شناخت نقش مدل های ذهنی دانشجویان کارشناسی دانشگاه شیراز در فرایند مرور در وب سایت های فروش کالا با توجه به میزان تجربه آنهاست. روش شناسی: این پژوهش به لحاظ هدف کاربردی است. نمونه مورد مطالعه شامل 90 دانشجوی داوطلب دانشگاه شیراز است. ابزار گردآوری داده ها شامل یک پرسش نامه محقق ساخته برای تعیین میزان تجربه و سطح کامل بودن مدل ذهنی کاربران و ضبط و مشاهده فایل های ثبت رخداد به منظور استخراج عملکرد مرور(میزان موفقیت و زمان) بود. یافته ها : یافته ها نشان داد بین کاربران با سطوح متفاوت کامل بودن مدل ذهنی از حیث میزان موفقیت در مرور، تفاوت معناداری وجود دارد. کاربرانی که مدل ذهنی کامل تری دارند بیشترین موفقیت و کاربران با مدل ذهنی ناقص، کمترین میزان موفقیت را دارند. از سوی دیگر، بین گروه های باتجربه و بی تجربه از نظر عملکرد مرور تفاوت وجود دارد، به طوری که کاربران باتجربه نسبت به کاربران بی تجربه در مدت زمان کمتری به موفقیت بیشتر در مرور دست می یابند. در گروه بندی افراد از نظر تلفیق تجربه و مدل ذهنی، نتایج نشان داد کاربران باتجربه با مدل ذهنی کامل، بیشترین و کاربران مبتدی با مدل ذهنی ناقص، کمترین موفقیت را در مرور دارند. ارزش/ اصالت : با وجود اهمیت شناخت وضعیت و سطح کامل بودن مدل ذهنی کاربران از قابلیت ها و ویژگی های  مرور، این مسئله کمتر مورد توجه قرار گرفته است.
۳۷.

مروری بر دشواریهای زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات(مقاله علمی وزارت علوم)

کلید واژه ها: زبان فارسی بازیابی اطلاعات نگارش املا

حوزه های تخصصی:
تعداد بازدید : ۳۳۶ تعداد دانلود : ۱۷۳
هدفهای پژوهش: زبان فارسی، به سبب ویژگیهای خاصّ آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواریهایی روبه روست که تأثیری بسزا بر اثربخشی بازیابی اطلاعات می گذارد. پژوهش حاضر می کوشد تا با بررسی متون و پیشینه های موجود، چالشهای نگارش فارسی، تأثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهاد های ارائه شده در جهت رفع این دشواریها را مورد بحث و بررسی قرار دهد. اهمیت پژوهش: با تحلیل و مرور جامع متونی که درباره چالشهای نگارش فارسی در محیطهای دیجیتال نگارش یافته است، می توان دانشی را که تاکنون در این باره گرد آمده است به تصویر کشید و کاستیها و پیشرفتهای به دست آمده در این زمینه را آشکار ساخت. روش پژوهش: روش پژوهش حاضر، متن پژوهی با رویکرد تحلیل محتواست که از روشهای پژوهش کیفی به شمار می آید. «پاراگراف»، «جمله» و «کلمه» به عنوان واحد تحلیل انتخاب شد، زیرا ممکن بود هر دشواری یا راهکار تنها در یک کلمه یا عبارت مورد اشاره قرار گرفته یا در جمله یا پاراگراف شرح داده شده باشد. یافته ها: آثار مورد بررسی، بیش از ۴۰ دشواری نگارشی را در رابطه با جستجو و بازیابی اطلاعات فارسی ذکر کرده اند. این گونه گونی نگارشی به نایکدستی و تطور بسیار در نگارش فارسی می انجامد که می تواند اثربخشی بازیابی را بویژه از منظر کاهش دقت یا ریزش کاذب و نیز کاهش جامعیت بازیابی، متأثر سازد. در نتیجه، ضروری است در طراحی الگوریتمهای سامانه های جستجو و بازیابی فارسی، به هنجارسازی تنوعات و چنددستیهای نگارشی و دستوری مد نظر قرار گیرد. تدوین استاندارد نگارش فارسی، استفاده از سیاهه های از پیش تعیین شده، تجهیز پایگاه اطلاعاتی به اصطلاحنامه و فرهنگهای املایی، و تدوین دستنامه یا راهنمای جستجو، از جمله راهکارهای ارائه شده است. این راهکارها با وجود جامع نبودن، کم و بیش اثربخش به نظر می رسند. نتیجه گیری: از آنجا که راهکارهای انسانی، نیازمند مشارکت فعّالانه و آموزش نویسندگان متون (تایپیستها و کاربران) است و از روندی بلندمدت و هزینه بر برخوردار است، حرکت به سوی راهکارهای خودکارسازی پردازش متن و نمایه سازی، ضروری است.
۳۸.

تحلیل کاربرد الگوی فراگفتمان هایلند در خلاصه سازی خودکار استناد مدار: پیشنهاد طرح حاشیه نویسی بافتارهای استنادی(مقاله علمی وزارت علوم)

کلید واژه ها: فراگفتمان هایلند بافتارهای استنادی خلاصه سازی استنادمدار طرح حاشیه نویسی متون علمی

حوزه های تخصصی:
تعداد بازدید : ۳۳۴ تعداد دانلود : ۳۳۸
هدف: هدف مقاله حاضر، تحلیل کاربرد الگوی فراگفتمان هایلند در خلاصه سازی خودکار استنادمدار متون علمی و پیشنهاد یک طرح حاشیه نویسی فراگفتمان مدار برای بافتارهای استنادی به منظور به کار گیری در خلاصه سازی استنادمدار می باشد. روش شناسی: روش شناسی این پژوهش از نوع کتابخانه ای است و پاسخ دهی به سؤالات پژوهش، از طریق مطالعه و تحلیل منابع مربوط به الگوی فراگفتمان هایلند، خلاصه سازی خودکار متون علمی، تحلیل بافتارهای استناد و طبقه بندی کارکردهای استناددهی انجام شده است. یافته ها: فراگفتمان تعاملی هایلند برای نشان دادن چشم انداز نویسنده نسبت به اطلاعات گزاره ای و خواننده به کار می رود، از ابزارهای زبانی مناسب ژانر نقد بهره می برد و برای تحلیل بافتارهای استنادی مناسب است. بنابراین، طرح حاشیه نویسی فراگفتمان مدار بافتارهای استنادی بر اساس تردیدنما، یقین نما، نگرش نما، خوداظهارها و دخیل سازها که از مؤلفه های اصلی فراگفتمان تعاملی - مشارکتی هایلند هستند، پیشنهاد شد. این طرح شامل 70 طبقه می باشد. نتیجه گیری: از فراگفتمان تعاملی هایلند می توان برای ساخت پیکره مناسب جهت خلاصه سازی خودکار استنادمدار بهره گرفت و مراحل ایجاد رده بند های مورد نیاز فرآیند خلاصه سازی، پالایش بافتارهای استنادی و انتخاب جملات برای درج در خلاصه نهایی را بر اساس آن انجام داد. حاشیه نویسی پیکره ها عموماً بر اساس یک طرح حاشیه نویسی انجام می شود. بنابراین، طرح پیشنهاد شده می تواند مفید واقع شود. با توجه به این که طرح حاشیه نویسی پیشنهاد شده مبتنی بر نظریات موجود است، لازم است در به کارگیری آن، از حاشیه نویسان خواسته شود تا در حین برچسب زنی، هر برچسب دیگری غیر از موارد مطرح شده در طرح را که به ذهنشان می رسد با ذکر دلیل، یادداشت نمایند تا در صورت احراز توافق مطلوب به طرح اضافه گردد.
۳۹.

شناسایی عوامل مؤثر در فرمول بندی عبارت جست وجو: مروری نظام مند(مقاله علمی وزارت علوم)

کلید واژه ها: رفتار اطلاع یابی فرایند جست وجو فرمول بندی عبارت جست وجو مرور نظام مند وظیفه جست وجو

حوزه های تخصصی:
تعداد بازدید : ۳۱۷ تعداد دانلود : ۱۶۳
هدف: شناسایی مهم ترین عوامل مؤثر در فرمول بندی عبارت جست وجو از طریق مرور نظام مند متون و سپس دسته بندی آن هاست. روش: پژوهش حاضر به شیوه کیفی و به روش فراترکیب تحلیلی در شش گام انجام شد که عبارت اند از: تعیین واژه های کلیدی، ایجاد معیارهای شمول و حذف مقالات، جست وجو در پیشینه، استخراج فهرست الف، ب و ج، تحلیل توصیفی و تحلیل مضمون. در این راستا، براساس چرخه جست وجو و با به کارگیری تعدادی کلیدواژه، که متخصصان تأیید کرده اند، پژوهش های مرتبط با عوامل مؤثر در فرمول بندی عبارت جست وجو مطالعه و بررسی شد. پس از تحلیل توصیفی این منابع، مفاهیم متناسب با موضوع استخراج شد. جامعه آماری این پژوهش شامل 102 مقاله بود که در زمینه شناسایی عوامل مؤثر در فرمول بندی عبارت جست وجو و در بازه زمانی 1991 تا 2021 نگاشته شده بودند. جست وجوی این منابع در پایگاه های معتبر نظیر وب آو ساینس، اسکوپس، اشپرینگر، امرالد، الزویر، اریک، پروکوئست، ابسکو، سایت سیر، اینفورمیشن ریسرچ، لیزا، لیستا و وایلی انجام شد. پس از استخراج مقالات و گردآوری و تحلیل داده های کیفی آن ها، از این تحلیل ها برای تعیین عوامل مؤثر در فرمول بندی عبارت جست وجو استفاده شد. یافته ها: عوامل مؤثر در فرمول بندی عبارت جست وجو خود از زمینه های متعددی همچون کاربر و وظیفه بازیابی نشئت می گیرد که می توان آن ها را به دو دسته کلیِ عوامل مرتبط با کاربر و عوامل مرتبط با وظیفه دسته بندی کرد. دسته اول شامل دانش موضوعی، دانش نحوه کار با سامانه جست وجو، تجربه جست وجو، زبان، ویژگی های جمعیت شناختی، عوامل بافتی، سبک شناختی، بار شناختی و دسته دوم شامل نوع وظیفه جست وجو و دشواری وظیفه بودند. این عوامل به صورت های مختلف فرایند فرمول بندی را متغیر می سازند. تأثیر ناشی از این عوامل را می توان به صورت مثبت و منفی در نظر گرفت؛ برخی از آن ها ممکن است به ارتقای کیفیت فرمول بندی کمک کنند. در مقابل، برخی دیگر ممکن است مانع انجام صحیح این مرحله از بازیابی شوند. نتیجه گیری: ازآنجاکه فرمول بندی بخش مهمی از رفتارهای اطلاع یابی است، شناخت عوامل مؤثر در این فرایند می تواند در کشف الگوهای اطلاع یابی مؤثر واقع شود. همچنین شناخت عوامل مؤثر در فرمول بندی عبارت جست وجو سبب بهبود کیفیت آموزش سواد اطلاعاتی از طریق متخصصان این حوزه می شود. از طرفی به طراحان و توسعه دهندگان وب نیز کمک می کند تا ابزارهای جست وجوی متناسب با نیاز کاربر را ایجاد کنند. ضمن اینکه درک چگونگی فرمول بندی عبارت جست وجو تحت تأثیر عوامل گوناگون و شناخت این عوامل، می تواند به افزایش کیفیت جست وجو و بازیابی نتایج مرتبط تر کمک کند و تعامل انسان رایانه را بهبود بخشد.
۴۰.

بررسی تنوع الگوهای نگارش فارسی و تاثیر آن بر جامعیت بازیابی اطلاعات : مطالعه موردی : پیکره همشهری(مقاله علمی وزارت علوم)

کلید واژه ها: بازیابی اطلاعات نگارش فارسی چالش پیکره همشهری

حوزه های تخصصی:
تعداد بازدید : ۲۵۴ تعداد دانلود : ۲۳۳
در الگوهای نگارش می تواند بر اثربخشی بازیابی اطلاعات فارسی تأثیر منفی داشته باشد. آشکار است که تلاش در جهت لحاظ کردن همه الگوها در الگوریتم های بازیابی اطلاعات فارسی، بر پیچیدگی آنها می افزاید و کارآیی سامانه های بازیابی اطلاعات را کاهش می دهد. از این رو، ضروری است با بررسی رفتارهای نگارندگان فارسی، میزان چندگانگی الگوها و تأثیر آن بر بازیابی اطلاعات در عمل و در نتیجه، ضرورت لحاظ کردن آنها در الگوریتم های فارسی آشکار گردد. روش پژوهش : در پژوهش حاضر که به روش تحلیل محتوای مفهومی انجام گرفته است، 7 چالش از میان 43 چالش نگارشی که با مرور ادبیات مربوط، شناسایی شده بود انتخاب گردید و پس از محاسبه تنوع و فراوانی رویداد آنها در متون پیکره همشهری، میزان انطباق شیوه نگارش آنها با دستور خط مصوب فرهنگستان زبان و ادب فارسی بررسی شد. یافته ها : نتایج پژوهش نشان داد نگارندگان متون پیکره به طور کلی تمایل به حذف یا جایگزینی نویسه های چالشی دارند. بنابراین، به نظر می رسد دست کم درباره هفت چالش مورد بررسی در این پژوهش، با نادیده گرفتن این چالش ها در سامانه های بازیابی اطلاعات، اثربخشی بازیابی چندان متأثر نمی شود. مقدار کلی شاخص«ضریب درگیری» برابر با 033/0 به دست آمد که بیانگر انطباق نداشتن گسترده الگوی نگارشی نگارندگان با دستور خط مصوب فرهنگستان است. از دلایل این امر می توان به تمایل نگارندگان به ساده نگاری در اثر «اصل کمترین کوشش» و عدم احساس ضرورت رعایت رسم الخط مرسوم عربی توصیه شده در دستور خط مصوب فرهنگستان، اشاره کرد.  

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان