مطالب مرتبط با کلیدواژه

بازیابی اطلاعات


۸۱.

سنجش رتبه بندی سامانه های پیشنهاددهنده مقاله در تقابل با رتبه بندی کاربران(مقاله علمی وزارت علوم)

کلیدواژه‌ها: رتبه بندی مدارک سامانه های پیشنهاددهنده مقالات سنجه NDCG بازیابی اطلاعات پایگاه وب آوساینس موتور جستجوی گوگل اسکالر

حوزه های تخصصی:
تعداد بازدید : ۴۴۲ تعداد دانلود : ۲۸۱
هدف: سامانه های پیشنهاددهنده مقاله های علمی در تلاش اند به جای الزام کاربر به اصلاح راهبرد جستجو و فرمول بندی واژگان پرسش، الگوریتم ها و رویکردهای مناسب را برای عرضه مرتبط ترین مدارک به کار گیرند. علاوه بر ربط، رتبه بندی مدارک بازیابی شده نیز می تواند رضایت کاربران را تضمین کند. این مقاله نتیجه تحلیل رتبه مقاله ها را در سامانه های پیشنهاددهنده پایگاه وب آوساینس و موتور جستجوی گوگل اسکالر از دیدگاه کاربران و سنجه (NDCG) Normalized Discounted Cumulative Gain گزارش می کند. روش شناسی: از 120 دانشجوی داوطلب دکترای دانشگاه شیراز در رشته های علوم انسانی، علوم پایه، فنی-مهندسی، کشاورزی، و دام پزشکی (از هریک ۳۰ نفر) خواسته شد 2400 مقاله (1200 مقاله پیشنهادی گوگل اسکالر و 1200 مقاله پایگاه وب آو ساینس) را به لحاظ ربط، رتبه بندی کنند. داده ها با پرسشنامه و نرم افزار پژوهشگرساخته گردآوری شد. یافته ها: میان رتبه انتسابی کاربران و رتبه انتسابی پایگاه شباهت ضعیف بود. شباهت رتبه بندی مقالات در سامانه های هر دو پایگاه نیز ضعیف، اما معنادار بود.الگوریتم ها و شاخص های سامانه های پیشنهاددهنده هر دو پایگاه برای رتبه بندی چندان موفق نیست و نیاز به بازنگری دارد . نتیجه گیری: الگوریتم ها و شاخص هایی که سامانه پیشنهاددهنده دو پایگاه برای رتبه بندی مقاله های مرتبط پیشنهادی درنظر گرفته اند، در تأمین رضایت کاربران زیاد موفق نبوده است؛ بنابراین بازنگری در الگوریتم های رتبه بندی این دو پایگاه ضروری به نظر می رسد.
۸۲.

عملکرد و هم پوشانی ابزارهای کاوش فازی و غیرفازی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازیابی اطلاعات دقت هم پوشانی ابزار کاوش غیرفازی ابزار کاوش فازی

حوزه های تخصصی:
تعداد بازدید : ۳۷۸ تعداد دانلود : ۳۲۷
هدف : شناسایی قدرت بازیابی ابزار کاوش فازی و غیرفازی و میزان هم پوشانی بین آنها. روش شناسی: این پژوهش با نمونه گیری طبقه ای تصادفی و هدفمند از میان همه ابزارهای کاوش فعال در وب انجام شده است. ابزار گردآوری داده ها سه سیاهه وارسی پژوهشگرساخته بوده است. یافته ها: ابزارهای غیرفازی متاکراولر، بینگ، و امرالد به ترتیب، و ابزارهای فازی گوگل، یاهو، و اسک بیشترین دقت را داشتند. در میان هر شش ابزار، گوگل قوی ترین و امرالد ضعیف ترین عملکرد را داشت. در جستجوی کلیدواژه ای، بینگ و متاکراولر بیشترین و در جستجوی سؤالی، یاهو و متاکراولر ببیشترین هم پوشانی را داشتند. در جستجوی عبارتی نیز بیشترین هم پوشانی بین یاهو و متاکراولر مشاهده شد. در سه جستجوی سؤالی، عبارتی، و کلیدواژه ای همه نتایج امرالد منحصر به فرد بود. نتیجه گیری: گوگل بهترین و امرالد ضعیف ترین عملکرد را داشتند. با اینکه متاکراولر یک ابرموتور کاوش محسوب می شود اما نسبت به گوگل که یک موتور کاوش عمومی است ضعیف تر بود. در کل، ابزارهای کاوش فازی عملکرد قوی تری داشتند. بیشترین هم پوشانی نیز در میان متاکراولر با یاهو و بینگ مشاهده شد.
۸۳.

بافت و معنا در بازیابی اطلاعات: با تاکید بر زبان مادری(مقاله علمی وزارت علوم)

نویسنده:

کلیدواژه‌ها: بازیابی اطلاعات بافت و معنا زبان مادری ویژگی های زبانی اطلاعات و زبان

حوزه های تخصصی:
تعداد بازدید : ۷۱۳ تعداد دانلود : ۶۲۸
زبان به ما امکان برقراری ارتباط می دهد و تقریباً همه موجودات زنده دارای این توانایی هستند. اما در رابطه با انسان علاوه بر نقش ارتباطی، دارای نقش های دیگری نیز هست. هدف از این مطالعه بیان نقش و اهمیت زبان با تاکید بر زبان مادری در شکل گیری واژگان جستجو در بازیابی اطلاعات مبتنی بر معانی ذهنی افراد، بافت و محتوای مورد جستجو است. مقاله حاضر یک پژوهش نظری است. در تدوین این مقاله و به عنوان گام نخست به روش کتابخانه ای و مروری، شناسایی منابع مرتبط و برخی نظریه های پایه در قلمرو زبان ضروری بود. بنابراین، کلیدواژه هایی همچون بازیابی اطلاعات، زبان مادری، بافت و معنا، اطلاعات و زبان و موارد مشابه جستجو شد. در نهایت پس از دستیابی به منابع با کیفیت و مرتبط، تلاش شد تا مفهوم زبان در بازیابی اطلاعات با تاکید بر زبان مادری و مفاهیم مرتبط با آن تحلیل و واکاوی شود. بر اساس آنچه که از این نوشتار می توان استنباط کرد، ابتدا مفاهیم در ذهن شکل می گیرد (یعنی مفهوم سازی ذهنی) و سپس مفاهیم شکل گرفته در ذهن تبدیل به اصطلاحات زبانی (بازنمون یا بیان واژگانی) می شود. بنابراین، در هنگام جستجو برای بازیابی اطلاعات ابتدا کاربر در ذهن خود مفاهیم را می سازد، سپس به آنها شکل می دهد و در ادامه واژه و یا واژگان مناسب را ایجاد کرده و به منزله عبارت جستجو در فیلد جستجوی یک پایگاه اطلاعاتی وارد می کند تا "با ربط ترین" نتایج، حاصل آید. این اتفاق برای کسی که مفاهیم ذهنی و مفاهیم ثبت شده (عینی) هر دو برای آن یکی باشد و به گونه ای براساس زبان مادری شکل گرفته باشد، می تواند نتایج بهتری را درپی داشته باشد، چرا که در این حالت بین ذهن و بیان آن رابطه ای مستقیم برقرار می شود و فضاهای ذهنی بهتری برای تدوین عبارت جستجو و ارزیابی نتایج بازیابی شکل می گیرد. زبان به عنوان رابط بین نیاز اطلاعاتی کاربر و سیستم اطلاعاتی، متکی بر الگوهای ذهنی است که انسان به واسطه یادگیری آنها را دریافت می کند و این الگوها معمولاً با یادگیری اولین زبان (زبان مادری) شکل می گیرد. بنابراین، بسیاری از تجربیات ما مبتنی بر مفاهیمی است که در ذهن ما شکل می گیرد و به واسطه زبان بیان می شود و این کار به دفعات می تواند در هنگام بازیابی اطلاعات رخ دهد. توجه به این مقوله می تواند به بهبود طراحی نظام های بازیابی اطلاعات در قالب بافت اطلاعاتی کمک کند.
۸۴.

نمایه سازی ماشینی مدارک حوزه بازیابی اطلاعات با استفاده از متن کاوی در نرم افزار «رپیدماینر»(مقاله علمی وزارت علوم)

کلیدواژه‌ها: نمایه سازی ماشینی دسته بندی رپیدماینر متن کاوی بازیابی اطلاعات

حوزه های تخصصی:
تعداد بازدید : ۷۲۶ تعداد دانلود : ۸۲۴
سازگاری کدهای رده بندی و اصطلاحات نمایه سازی از یک اصطلاحنامه مدون با عبارات و کلماتی که به طور خودکار استخراج شده با استفاده از نمایه سازی ماشینی ایجاد می شود. در طراحی نظام نمایه سازی خودکار، کامپیوتر به طور کامل جایگزین انسان می شود. این پژوهش با هدف اس تخراج کلم ات کلی دی و شناسایی گرایش های موضوعی مقالات نمونه آماری در حوزه بازیابی اطلاعات و تخصص موضوعی نویسنده هر مقاله با روش متن کاوی و دسته بندی آنها با استفاده از هم رخدادی واژگان صورت گرفته است. روش این پژوهش از نوع کاربردی است و براساس مدل کریسپ [1] از مدل های فرآیند داده کاوی و الگوریتم های متن کاوی انجام گرفته است. جامعه پژوهش، 313 مقاله حوزه بازیابی اطلاعات نمایه شده در پایگاه نورمگز است. پس از نرمال سازی متن مقالات با نرم افزار ویراستیار، طی متن کاوی مقالات با نسخه 7.1 نرم افزار رپیدماینر، واژگان کلیدی از طریق محاسبه وزن آنها استخراج و داده ها با استفاده از دو الگوریتم کلاسیک دسته بندی یعنی ک.ان.ان. [2] و نایوبیز [3] تجزیه و تحلیل شدند. در پژوهش حاضر، کامپیوتر با کمک ابزارهای متن کاوی نرم افزار رپدماینر، متن ماشین خوان را با استفاده از بسامد واژه ها به طور خودکار نمایه سازی کرده است. بدین منظور با کمک عملگرهای ان-گرام [4] و محاسبه وزن کلمات براساس روش تی.اف ای.دی.اف . [5] ، اصطلاحات و مفاهیم کلیدی و تخصص موضوعی نویسنده هر مقاله در قالب 16 دسته بندی استخراج شده است. سرانجام برتری مدل ک.ان.ان. در دسته بندی موضوعات هسته مقالات این پژوهش با دقت 85 درصدی نسبت به مدل نایوبیز تایید شد . مشاهده نتایج محاسبه دقت های ماخوذه مدل ها، گواه کارایی قابل قبول نرم افزار رپیدماینر در نمایه سازی ماشینی متون است. نمایه سازی متون با استفاده از این روش، می تواند به بهبود نتایج بازیابی اطلاعات و جلوگیری از ریزش کاذب اطلاعات در پایگاه های اطلاعاتی کمک کند.
۸۵.

کاربردپذیری اصطلاحات غیرموضوعی مورد استفاده در نمایه سازی منابع علوم اسلامی در فرایند بازیابی اطلاعات(مقاله علمی وزارت علوم)

کلیدواژه‌ها: کاربردپذیری اصطلاحات غیرموضوعی نما یه سازی بازیابی اطلاعات منابع علوم اسلامی

حوزه های تخصصی:
تعداد بازدید : ۴۸۷ تعداد دانلود : ۴۳۷
هدف از پژوهش حاضر، تبیین کاربردپذیری اصطلاحات غیرموضوعی (عمومی) مورد استفاده در نمایه سازی منابع علوم اسلامی در فرایند بازیابی اطلاعات بود. ج امعه پژوهش را که با روش پیمایشی- تحلیلی انجام شد، کاربران نهایی پایگاه مدیریت اطلاعات علوم اسلامی طراحی شده توسط پژوهشکده مدیریت اطلاعات و مدارک اسلامی تشکیل می دادند. در میان این جامعه، 50 نفر از پژوهشگران بر پایه نمونه گیری در دسترس از نوع هدفمند که با پایگاه مدیریت اطلاعات علوم اسلامی آشنایی مناسبی داشتند و از آن استفاده می نمودند، انتخاب شدند. ابزار گردآوری داده ها در این پژوهش، سه پرسشنامه طراحی شده توسط پژوهشگران بود. این پرسشنامه ها عبارت بودند از: نخست، پرسشنامه مربوط به میزان تجربه کاربران نهایی در استفاده از پایگاه مورد بررسی، دیگر، پرسشنامه تشریحی جهت دریافت بازخورد کاربران نهایی نسبت به فرایند بازیابی، و دو دیگر، پرسشنامه ای با پرسش های بسته برای ارزیابی نتایج جستجو بود که روایی آن ها توسط متخصصان ذخیره و بازیابی اطلاعات، و پایایی آن ها بر اساس آزمون آلفای کرونباخ مورد تأیید قرار گرفت. برای تجزیه و تحلیل داده ها از شاخص های آمار استنباطی در جهت آزمون فرضیه های پژوهش استفاده شد. یافته های پژوهش حاکی از آن است که استفاده از اصطلاحات غیرموضوعی (عمومی) برای بسط جستجو در پایگاه مدیریت اطلاعات علوم اسلامی نتایج مطلوبی در بر داشته است. با این وجود، به گسترش اصطلاحات غیرموضوعی بر اساس نظرات و پیشنهادات کاربران نهایی عضو جامعه پژوهش نیاز است. همچنین همخوان با پاسخ کاربران به پرسش ها، بین اصطلاحات غیرموضوعی برگزیده و ناگزیده، روابط هم ارز مناسبی برقرار شده است. نتایج حاصل از این پژوهش بیان می دارد که توجه به کاربردپذیری اصطلاحات غیرموضوعی در فرایند بازیابی اطلاعات، نیز برقراری روابط هم ارز بین آن ها، افزون بر بهره گیری از اصطلاحات موضوعی (تخصصی)، می تواند نتایج مطلوب و مرتبطی را در زمان بازیابی اطلاعات به همراه داشته باشد.
۸۶.

کشف ارتباطات مفهومی آیات قرآن کریم در بستر تفاسیر قرآن با استفاده از تکنیک های داده کاوی(مقاله پژوهشی حوزه)

کلیدواژه‌ها: بازیابی اطلاعات داده کاوی ارتباط بین متون ارتباط مفهومی بین آیات قرآن قرآن

حوزه های تخصصی:
تعداد بازدید : ۶۰۰ تعداد دانلود : ۴۰۱
کشف ارتباط بین آیات قرآن، به درک دقیق تر آیات و شناخت بعضی مفاهیم مجهول کمک می کند. در کتب تفسیر، شماری از آیات مرتبط بیان شده است و باهم آیی دو آیه در یک پاراگراف در کتب تفسیر و علوم قرآنی، می تواند ارتباط مفهومی بین آیات قرآن را مشخص کند. کتب نرم افزار جامع تفاسیر نور، تولید مرکز تحقیقات کامپیوتری علوم اسلامی، مبنای کار قرار گرفت و از آیاتی که با هم در یک پاراگراف بودند، پُرتکرارترین باهم آیی ها استخراج شد. این پژوهش نشان می دهد که استفاده از تکنیک های داده کاوی می تواند ارتباط های پنهان میان داده ها را کشف و استخراج نماید. ارزیابی کمّی و کیفی این تحقیق، در دو مرحله انجام شده است؛ در ابتدا از ضرایب پشتیبان و اطمینان و معیار لیفت و تشابه جاکارد و تشابه کسینوسی برای ارزیابی الگوهای تکراری و قواعد باهم آیی و صحت کشف ارتباط بین آیات استفاده شد؛ سپس نتایج به دست آمده از مقایسه این تحقیق با کار محققان دیگر، برتری پژوهش حاضر را بر رقبای خود نشان می دهد.
۸۷.

بازیابی منابع اسلامی بر پایه فهم معاصر کاربران؛ نگاهی پست مدرن به سازمان دهی و بازیابی دانش اسلامی

کلیدواژه‌ها: بازیابی اطلاعات پست مدرنیسم سازمان دهی دانش علوم اسلامی مدرنیسم

حوزه های تخصصی:
تعداد بازدید : ۴۰۶ تعداد دانلود : ۵۰۹
سازمان دهی دانش که برای دسترسی آسان، دقیق و سریع به محتوای دانش انجام می پذیرد، با استفاده از فراداده های برآمده از واژگان کنترل شده و استاندارد صورت می گیرد. این فراداده های استاندارد حاصل نظر جامعه علمی و متخصصان موضوعی آن علم است. بر پایه رهیافت سنتیِ سازمان دهی و بازیابی دانش، میان اطلاعات و دانش و انسان دوگانگی وجود دارد و سازمان دهی دانش به مثابه امری عینی و توصیف های خنثی از یک جهانِ دانشِ از پیش موجود است. در نگاه سنتی، امر ادراک شده، آیینه تمام نمای واقعیت است. این تصور از عینیت گرایی و خنثی بودن، با ظهور اندیشه پست مدرنیسم فرو نشست. در نگاه پست مدرن، امر واقع، حقیقت و دانش به مثابه امر ساخته وپرداخته شده در جامعه گفتاری خاص است؛ بنابراین نظریه پست مدرن، سازمان دهی اطلاعات به مثابه تعامل فعال انسان با مفاهیم و اطلاعات برای برساختن نظام هایی از سازمان دهی دانش است. ازاین روی، قوانین، دستورالعمل ها و استانداردهای سازمان دهی اطلاعات کمتری موردتوجه قرار می گیرد و آنچه مهم است پویایی برداشت ها از متون و ازاین روی، پویایی ساختار محتوا و فرایند تفسیری در سازمان دهی دانش است. در حوزه علوم اسلامی، این امر از اهمیت بیشتری برخوردار است؛ زیرا متون اسلامی، مانند منابع علوم قرآن و علوم حدیث، مبنای احکام شرعی و مبانی اخلاقی و اعتقادی اند و سازمان دهی دقیق و درست این منابع، سبب بازیابی درست و درنتیجه احکام درست شرعی، اخلاقی و اعتقادی خواهد بود.
۸۸.

بررسی تکنیک های بهبود عملکردروش های بسامدشماری پیکره بنیاد دراستخراج خودکار واژگان مورد مطالعه: (واژگان پایه علوم پزشکی)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: استخراج خودکار واژگان علوم پزشکی پیکره روشهای ترکیبی استخراج آموزش زبان فارسی بازیابی اطلاعات

حوزه های تخصصی:
تعداد بازدید : ۳۷۷ تعداد دانلود : ۴۶۱
امروزه شاهد گسترش استفاده از روش های پیکره بنیاد در زبان شناسی هستیم. پژوهش حاضر به بررسی تکنیک های بهبود عملکرد روش های بسامد شماری در زبان فارسی و با منظور دستیابی به رویه علمی جهت استخراج خودکار واژگان پایه علوم پزشکی انجام پذیرفته است.استفاده از روشهای آماری در کنار ابزار زبانشناسی پیکره ای ( روشهای استخراج خودکار ترکیبی )جهت استخراج خودکار واژگان در تعدادی از زبانهای دنیا همچون انگلیسی ،فرانسه،ژاپنی و کره ای طی چند دهه اخیر بسیار رایج بوده است ، حال آنکه در زبان فارسی این روشها تا کنون به صورت جدی مورد استفاده قرارگرفته نشده اند و اغلب استخراج ها در زبان فارسی به روش سنتی انجام گرفته اند. ضمن آنکه بکار گیری این روشها در هر زبانی متفاوت است و در هر زبان با توجه به ویژگیهای زبانشاختی آن زبان برون داد روشهای آماری متفاوت است. از این رو باید مطابق با ویژگیهای هر زبان در این روشها تغییراتی اعمال کرد تا در نهایت بتوان به روشی جهت استخراج خودکار واژگان دست یافت.جهت نیل به این هدف در زبان فارسی، از خانواده مدل های بسامد شماری با رویکردهای بسامد شماری پیکره عمومی، بسامد شماری پیکره اختصاصی و روش های بهبودیافته آن ها استفاده شده است. بسامدشماری به کار رفته در پژوهش، برپایه پردازش اطلاعات واژگان در دو پیکره اصلی و اختصاصی که محقق آنرا ایجاد کرده است و از این پس آنرا پیکره محقق ساخته می نامیم، صورت گرفته است . پیکره محقق ساخته شامل متون درس زیست شناسی دوره اول تا چهارم دبیرستان، متون درس علوم دوم و سوم راهنمایی، متون تدریس شده در مرکزآموزش زبان فارسی امام خمینی قزوین، مجلات و مقالات حوزه پزشکی عمومی و پیکره عمومی مورد استفاده ، پیکره روزنامه همشهری ( نسخه دوم) می باشد. نتایج بدست آمده نشان می دهد که قابلیت استفاده از روش های بسامد شماری پیکره بنیاد در زبان فارسی برای دست یافتن به شیوه ای واحد در استخراج خودکار واژگان وجود دارد.شیوه آتی که به یقین می تواند گامی موثر در تهیه و تدوین متون آموزشی زبان فارسی و گسترش آموزش این زبان به شمار آید. از عمده ترین مشکلات استفاد از روش های ساده، جداسازی واژگان پرتکرار همچون حروف ربط را می توان برشمرد. از این رو جهت بالابردن توان مدل با اعمال روش هایی می توان روش های اولیه را بهبود بخشید. مشاهده می شود که روش بسامدشماری بهبود یافته در پیکره اختصاصی از سایر روش ها عملکرد بهتری داشته و تا ۶۰ درصد واژگان تخصصی را در ۵۰ واژه پر بسامد شناسایی می نماید. از سوی دیگر مشاهده می گردد که با افزایش دامنه واژگان مورد بررسی در پژوهش از ۵۰ به ۱۰۰، ۱۵۰ و ۲۰۰ دقت مدل ها افزایش یافته و درصد واژگان تخصصی انتخاب شده به ثبات می رسد.
۸۹.

شناسایی چالش های برگردان اسامی فارسی به انگلیسی در پایگاه وب آو ساینس(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازیابی اطلاعات پایگاه وب آوساینس برگردان انگلیسی به فارسی چالش های برگردان نام ها

حوزه های تخصصی:
تعداد بازدید : ۵۷۴ تعداد دانلود : ۴۹۴
هدف پژوهش حاضر، شناخت چالش های برگردان نام های فارسی به انگلیسی و فراوانی این چالشها در پایگاه وب آف ساینس است. این پژوهش به لحاظ هدف کاربردی و از نظر نحوه گردآوری داده ها کمی از نوع پیمایشی است. جامعه ی پژوهش شامل نام های نویسندگان ایرانی در پایگاه وب آف ساینس می باشد که در بازه ی زمانی هفت ساله ی 2010 تا 2017 مقاله ی انگلیسی نگاشته اند. تعداد 3110873 نام در ابتدا بازیابی شد که پس از پالایش و یکدست سازی اسامی به 11242 نام تقلیل یافت. به منظور پالایش، آماده سازی و تحلیل داده ها از نرم افزار بیب اکسل، اکسل و پایگاه وب آف ساینس استفاده شد. یافته های پژوهش نشان داد در برگردان نام ها از فارسی به انگلیسی چهار گروه چالش های مربوط به "همخوان ها"، چالش های مربوط به "واکه ها" ، چالش های مربوط به "حذف یا تکرار حروف" و چالش های "تلفظی" وجود دارد. در دسته ی اول، چالش های همخوان ها، نویسندگان و نگارندگان در برگردان نام ها در یازده حرف (8 واج)، شامل حروف ق، غ، ژ، ع، و، ک، ج، ک، ث، س، ص، صورت های مختلف نگارشی داشته اند. در دسته ی دوم (چالش واکه ها)، صورت های نگارشی مختلفی در برگردان واکه های (/ i / ، / u /، توالی واج های / e / و / j / ،/ o / ) و پایانه ( ِه) از فارسی به انگلیسی مشاهده شد. در دسته ی سوم، وجود حروف مشدد و حروف (ال) در برخی نام ها موجب به وجود آمدن چندگانگی در نگارش نام ها شده است . و در نهایت در در دسته آخر، آواهای اَ و اِ، و همچنین حذف برخی حروف به علت تفاوت در تلفظ نام ها در گویش ها و زبان های مختلف دچار چندگانگی شده اند. با توجه به اهمیت بازیابی اسامی در جستجوی نویسندگان و همچنین در ارزیابی پژوهش، راهکارهایی همچون استفاده از عملگر های بولی و نویسه جایگزین بین صورت های نگارشی غالب، ایجاد ساندکس زبان فارسی، مجهز کردن پایگاه به ابزارهای دانشی ویژه نام ، جهت یکدستی در برگردان نام ها ضرورت دارد.
۹۰.

نقش ویژگی های جمعیت شناختی دانشجویان دانشگاه فردوسی مشهد در نمره ربط نتایج بازیابی شده موتورهای کاوش(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ربط متغیرهای جمعیت شناختی بازیابی اطلاعات دانشجویان دانشگاه فردوسی مشهد

حوزه های تخصصی:
تعداد بازدید : ۷۳۱ تعداد دانلود : ۲۹۸
هدف: برای طراحی نظام های بازیابی اطلاعات کاربرپسند، توجه به ویژگی های کاربران از اهمیت زیادی برخوردار است. از این رو، هدف پژوهش حاضر این است تا نقش متغیرهای جمعیت شناختی کاربران هنگام جست وجو در موتورهای کاوش مورد بررسی قرار گیرد. روش: این پژوهش از نظر هدف کاربردی بود که از روش ارزیابانه استفاده شد. در این پژوهش، ابتدا با توجه به ویژگی های جمعیت شناختی نظیر جنسیت، مقطع و حوزه تحصیلی، گروه سنی و منطقه سکونت دانشجویان دانشگاه فردوسی مشهد، تعداد 192 نفر به عنوان اعضای نمونه انتخاب شدند و سپس، از آن ها درخواست شد تا وظایف کاری تدوین شده بر اساس عناوین انتخاب شده از سرعنوان موضوعی فارسی را مطالعه و در موتورهای کاوش گوگل، پارسی جو، ریسمون و یوز به زبان فارسی جست وجو و سپس نشانی های اینترنتی مرتبط را در فرم داده شده ثبت کنند. براساس نشانی های اینترنتی ثبت شده، نمره ربط نتایج بازیابی شده دانشجویان با توجه به شاخص جاکارد محاسبه شد. یافته ها: یافته های پژوهش نشان داد که نمره ربط نتایج بازیابی شده توسط دانشجویان دانشگاه فردوسی مشهد با سطح اطمینان 95 درصد در حدود 36/0 تا 42/0 قرار داشت؛ همچنین، بین نمره ربط نتایج بازیابی شده توسط دانشجویان برحسب مقطع تحصیلی، گروه های سنی و منطقه سکونت آنان تفاوت معناداری وجود داشت؛ در حالی که تفاوت معناداری بین نمره ربط نتایج بازیابی شده توسط دانشجویان برحسب جنسیت و حوزه تحصیلی آنان مشاهده نشد. اصالت/ارزش: این مقاله توجه مدیران اطلاعات و طراحان نظام های بازیابی اطلاعات را به این موضوع معطوف می کند که در طراحی نظام های اطلاعاتی توجه به سه متغیر جمعیت شناختی تحصیلات، سن و منطقه سکونت نسبت به دو متغیر حوزه های تحصیلی و جنسیت از اهمیت بیشتری برخوردار است.
۹۱.

پرکاربردترین عملکردهای پردازش زبان طبیعی در حوزه علوم کتابداری و اطلاع رسانی

کلیدواژه‌ها: پردازش زبان طبیعی علوم کتابداری و اطلاع رسانی بازیابی اطلاعات

حوزه های تخصصی:
تعداد بازدید : ۵۸۰ تعداد دانلود : ۴۵۶
هدف از پژوهش حاضر، بررسی پرکاربردترین کارکردهای پردازش زبان طبیعی در حوزه علوم کتابداری و اطلاع رسانی بوده است. پژوهش حاضر به روش تحلیل اسنادی یا کتابخانه ای و با مداقه و بررسی و تحلیل متون انجام شده است. یافته ها نشان داد که تاکنون کاربردهای مهمی از پردازش زبان طبیعی در حوزه های مختلف انجام شده است. در این پژوهش پرکاربردترین کارکردهای پردازش زبان طبیعی در حوزه علوم کتابداری و اطلاع رسانی عبارت بودند از: نمایه سازی خودکار، استخراج خودکار اطلاعات یا خلاصه سازی خودکار، بازیابی اطلاعات، بازیابی اطلاعات بین زبانی (نظام بازبین)، بازیابی اطلاعات موسیقیایی، رده بندی خودکار و سیستم های پرسش و پاسخ. نتایج نشان داد که پردازش زبان طبیعی، همچنان دارای قابلیت های خوب و مفیدی در حوزه های مختلف و ازجمله در رشته علوم کتابداری و اطلاع رسانی است که باید با برشمردن مزایا و هزینه ها، نسبت به ادغام پردازش زبان طبیعی در حوزه های موضوعی مختلف اقدام نمود.
۹۲.

آینده سامانه های بازیابی اطلاعات متنی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: سامانه های بازیابی اطلاعات متنی سامانه های بازیابی اطلاعات بازیابی اطلاعات آینده نگاری

حوزه های تخصصی:
تعداد بازدید : ۶۳۸ تعداد دانلود : ۴۳۰
هدف: شناسایی عوامل مؤثر بر آینده سامانه های بازیابی اطلاعات متنی هدف این پژوهش است. روش شناسی: داده ها از متون و پیمایش نظرات متخصصان بازیابی اطلاعات به روش نمونه گیری هدفمند گردآوری شده است. یافته ها: بُعد فناوری بیشترین تأثیر را بر آینده سامانه های بازیابی اطلاعات خواهد داشت. بُعد هوش مصنوعی با ضریب 93 مؤثرترین شناخته شد. حق مؤلف در بُعد سیاسی با ضریب86 و وابسته شدن مشاغل به اطلاعات در بُعد اجتماعی-فرهنگی با ضریب 87 و برنامه های همراه با ضریب 86 در شاخص اقتصادی مهمترین عوامل موثر بر آینده سامانه های متنی خواهد بود.
۹۳.

تجربه زیسته متخصصان کتابداریِ پزشکی در زمینه ربط اطلاعات در شبکه اجتماعی لینکدین(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازیابی اطلاعات ربط شبکه های اجتماعی لینکدین

حوزه های تخصصی:
تعداد بازدید : ۴۳۳ تعداد دانلود : ۳۷۰
هدف: شناسایی عوامل مؤثر بر بهبود ربط در بازیابی اطلاعات در شبکه اجتماعی لینکدین. روش: 17 مشارکت کننده (9 مرد و 8 زن) به روش نمونه گیری هدفمند انتخاب شدند و در مصاحبه نیمه ساختاریافته شرکت کردند. داده ها به روش دیکلمنکدگذاری و تحلیل شد. یافته ها: استخراج 441 کد اولیه و هفت مقوله شامل سامانه اطلاعاتی ، سامانه بازیابی ، ویژگی های سند ، ویژگی های پایگاه ، ویژگی های کاربر ، درخواست ها و پرسش ها و وجود بازخورد از داده ها استخراج شد و نشان داد شبکه لینکدین نقش مهمی در رفع نیازهای اطلاعاتی مشارکت کنندگان دارد.
۹۴.

معناشناسی در سامانه های برچسب گذاری اجتماعی: یک مرور نظام مند(مقاله علمی وزارت علوم)

کلیدواژه‌ها: فوکسونومی برچسب گذاری اجتماعی روابط معنایی بازیابی اطلاعات مرور نظام مند

حوزه های تخصصی:
تعداد بازدید : ۷۸۳ تعداد دانلود : ۶۶۳
هدف: مرور نظام مند پژوهش های حوزه معناشناسی در سامانه های برچسب گذاری اجتماعی، به منظور شناسایی شاخه های موضوعی قابل توجه پژوهشگران، مرور راهکارهای رفع یا کاهش اثرات مسائل معناشناسی بر بازیابی اطلاعات در این سامانه ها و شناسایی شکاف های پژوهشی این حوزه است. روش پژوهش : پژوهش به روش مرور نظام مند انجام گرفته است. به این منظور، با جستجو در پایگاه های اطلاعاتی، 101 مقاله پژوهشی به زبان انگلیسی در بازه زمانی 2003-2019 انتخاب و پس از پالایش، 44 پژوهش تحلیل شد. یافته ها: محورهای موضوعی مهم شامل طراحی یک سامانه برچسب گذاری معنایی، استفاده از وردنت برای تعیین رابطه معنایی میان برچسب ها، بهره گیری از بافت برای ابهام زدایی از معنای برچسب، تولید الگوریتم برچسب گذاری معنایی خودکار بودند. خلأهای پژوهشی برای انجام پژوهش های آتی عبارتند از: ابداع روشی برای شناسایی منابع حاوی معنایی خاص از یک برچسب بدون نیاز به بررسی همه منابع، بررسی امکان استفاده از روش های خوشه بندی برچسب ها برای خوشه بندی منابع. نتیجه گیری: با توجه به شکاف های پژوهشی همچنان مسئله معنا در سامانه های برچسب گذاری می تواند از حوزه های مهم مطالعات پژوهشی سازماندهی اطلاعات باشد.
۹۵.

نقش متغیرهای جمعیت شناختی در میزان بسامد سوگیری های شناختی در فرایند بازیابی اطلاعات(مقاله علمی وزارت علوم)

کلیدواژه‌ها: سوگیری های شناختی بازیابی اطلاعات جنسیت حوزه تحصیلی مقطع تحصیلی

حوزه های تخصصی:
تعداد بازدید : ۳۷۴ تعداد دانلود : ۳۲۵
در بیشتر مدل های بازیابی اطلاعات به نقش مهم عوامل مختلف شناختی در مراحل مختلف بازیابی اطلاعات اشاره شده است؛ از این رو، درک جنبه های شناختی رفتار و تعامل انسان با اطلاعات موضوعی ضروری است. از آن جایی که یکی از جنبه های شناختی اثرگذار در فرایند جستجوی اطلاعات، سوگیری های شناختی است و کاربران در هنگام جستجوی اطلاعات این سوگیری های شناختی را تجربه می کنند، باید به تأثیر این سوگیری ها در فرایند بازیابی اطلاعات پرداخت. بر این اساس، هدف از پژوهش حاضر بررسی نقش متغیرهای جمعیت شناختی در میزان بسامد سوگیری های شناختی در فرایند بازیابی اطلاعات است. پژوهش حاضر، به لحاظ روش شناسی، پژوهشی پیمایشی، و از نظر هدف، کاربردی است که روش گردآوری داده ها در آن به صورت ترکیبی (کمّی و کیفی) صورت گرفته است. جامعه پژوهش حاضر را دانشجویان تحصیلات تکمیلی دانشگاه فردوسی مشهد در دو گروه علوم انسانی و فنی-مهندسی که در نیمسال دوم سال تحصیلی98-97 در این دانشگاه مشغول به تحصیل بودند، تشکیل می دادند. تعداد30 نفر به روش نمونه گیری طبقه ای، به عنوان نمونه پژوهش انتخاب شدند. از 2 ابزارِ فایل های ثبت رخداد و مصاحبه نیمه ساختار یافته مبتنی بر یک سیاهه دربرگیرنده انواع سوگیری های شناختی برای گردآوری اطلاعات استفاده شد. روایی محتوایی پرسش های مصاحبه با نظر متخصصان حوزه بازیابی اطلاعات و روان شناسی تایید شد و پایایی هر دو ابزار نیز با ضریب توافق بین نظرات دو ارزیاب که برابر با 95/. بود، مورد تایید قرار گرفت. یافته های پژوهش نشان داد که در 3 سوگیری "اتکا"، "تأثیر توجه" و "تأثیر مواجهه صرف" بین میزان بسامد کاربران بر اساس جنسیت تفاوت معناداری وجود دارد. همچنین سوگیری های شناختی "اعتماد به نفس بیش از اندازه"، "روزآمدی اطلاعات"، "تأثیر توجه" و "دسترسی پذیری" نیز در بین دو مقطع تحصیلی کارشناسی ارشد و دکتری دارای تفاوت معناداری بودند. دیگر یافته نیز نشان داد که بین میزان سوگیری های شناختی رخ داده کاربران در دو گروه کاربران (حوزه علوم انسانی و حوزه فنی-مهندسی) در 3 سوگیری "روزآمدی اطلاعات"، "تأثیر توجه"، و "تأثیر مواجهه صرف" تفاوت معناداری وجود داشت. بر اساس یافته های پژوهش می توان چنین نتیجه گرفت که چون متغیرهای جمعیت شناختی (جنسیت، مقطع تحصیلی و حوزه تحصیلی) می توانند بر میزان بسامد برخی از سوگیری های شناختی در فرایند جستجوی اطلاعات موثر باشند، طراحان نظام های بازیابی اطلاعات و کتابداران باید به این موضوع در طراحی و ارزیابی نظام های اطلاعاتی توجه نمایند. البته در این بین نباید تاثیر عواملی مثل گروه سنی، تیپ های شخصیتی، طرح واره های ذهنی، فرهنگ، میزان سواداطلاعاتی را نیز نادیده گرفت.
۹۶.

رویکردهای ارزیابی نظامهای بازیابی اطلاعات: پس زمینه و چشم انداز پیش رو(مقاله علمی وزارت علوم)

نویسنده:

کلیدواژه‌ها: ارزیابی نظامها بازیابی اطلاعات رویکردهای ارزیابی

حوزه های تخصصی:
تعداد بازدید : ۲۹۱ تعداد دانلود : ۱۵۹
این نوشتار با نگاهی گذرا به سیر تکاملی نظامهای بازیابی اطلاعات و ارزیابی آنها، انواع ارزیابی در این نظامها را از هم تفکیک و  به طور مفصل تر درباره رویکردهای موجود در ارزیابی عملکرد نظامهای بازیابی، بحث کرده است. با نقد هرکدام، مدلی ترکیبی با رویکردی نظری - تصمیمی از «وانگ و فورگیونه» را معرفی می کند و در پایان نتایج و پیشنهادهای خود را ارائه می دهد.
۹۷.

مروری بر دشواریهای زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات(مقاله علمی وزارت علوم)

کلیدواژه‌ها: زبان فارسی بازیابی اطلاعات نگارش املا

حوزه های تخصصی:
تعداد بازدید : ۳۸۸ تعداد دانلود : ۲۲۳
هدفهای پژوهش: زبان فارسی، به سبب ویژگیهای خاصّ آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواریهایی روبه روست که تأثیری بسزا بر اثربخشی بازیابی اطلاعات می گذارد. پژوهش حاضر می کوشد تا با بررسی متون و پیشینه های موجود، چالشهای نگارش فارسی، تأثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهاد های ارائه شده در جهت رفع این دشواریها را مورد بحث و بررسی قرار دهد. اهمیت پژوهش: با تحلیل و مرور جامع متونی که درباره چالشهای نگارش فارسی در محیطهای دیجیتال نگارش یافته است، می توان دانشی را که تاکنون در این باره گرد آمده است به تصویر کشید و کاستیها و پیشرفتهای به دست آمده در این زمینه را آشکار ساخت. روش پژوهش: روش پژوهش حاضر، متن پژوهی با رویکرد تحلیل محتواست که از روشهای پژوهش کیفی به شمار می آید. «پاراگراف»، «جمله» و «کلمه» به عنوان واحد تحلیل انتخاب شد، زیرا ممکن بود هر دشواری یا راهکار تنها در یک کلمه یا عبارت مورد اشاره قرار گرفته یا در جمله یا پاراگراف شرح داده شده باشد. یافته ها: آثار مورد بررسی، بیش از ۴۰ دشواری نگارشی را در رابطه با جستجو و بازیابی اطلاعات فارسی ذکر کرده اند. این گونه گونی نگارشی به نایکدستی و تطور بسیار در نگارش فارسی می انجامد که می تواند اثربخشی بازیابی را بویژه از منظر کاهش دقت یا ریزش کاذب و نیز کاهش جامعیت بازیابی، متأثر سازد. در نتیجه، ضروری است در طراحی الگوریتمهای سامانه های جستجو و بازیابی فارسی، به هنجارسازی تنوعات و چنددستیهای نگارشی و دستوری مد نظر قرار گیرد. تدوین استاندارد نگارش فارسی، استفاده از سیاهه های از پیش تعیین شده، تجهیز پایگاه اطلاعاتی به اصطلاحنامه و فرهنگهای املایی، و تدوین دستنامه یا راهنمای جستجو، از جمله راهکارهای ارائه شده است. این راهکارها با وجود جامع نبودن، کم و بیش اثربخش به نظر می رسند. نتیجه گیری: از آنجا که راهکارهای انسانی، نیازمند مشارکت فعّالانه و آموزش نویسندگان متون (تایپیستها و کاربران) است و از روندی بلندمدت و هزینه بر برخوردار است، حرکت به سوی راهکارهای خودکارسازی پردازش متن و نمایه سازی، ضروری است.
۹۸.

بررسی تنوع الگوهای نگارش فارسی و تاثیر آن بر جامعیت بازیابی اطلاعات : مطالعه موردی : پیکره همشهری(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازیابی اطلاعات نگارش فارسی چالش پیکره همشهری

حوزه های تخصصی:
تعداد بازدید : ۳۰۶ تعداد دانلود : ۲۷۰
در الگوهای نگارش می تواند بر اثربخشی بازیابی اطلاعات فارسی تأثیر منفی داشته باشد. آشکار است که تلاش در جهت لحاظ کردن همه الگوها در الگوریتم های بازیابی اطلاعات فارسی، بر پیچیدگی آنها می افزاید و کارآیی سامانه های بازیابی اطلاعات را کاهش می دهد. از این رو، ضروری است با بررسی رفتارهای نگارندگان فارسی، میزان چندگانگی الگوها و تأثیر آن بر بازیابی اطلاعات در عمل و در نتیجه، ضرورت لحاظ کردن آنها در الگوریتم های فارسی آشکار گردد. روش پژوهش : در پژوهش حاضر که به روش تحلیل محتوای مفهومی انجام گرفته است، 7 چالش از میان 43 چالش نگارشی که با مرور ادبیات مربوط، شناسایی شده بود انتخاب گردید و پس از محاسبه تنوع و فراوانی رویداد آنها در متون پیکره همشهری، میزان انطباق شیوه نگارش آنها با دستور خط مصوب فرهنگستان زبان و ادب فارسی بررسی شد. یافته ها : نتایج پژوهش نشان داد نگارندگان متون پیکره به طور کلی تمایل به حذف یا جایگزینی نویسه های چالشی دارند. بنابراین، به نظر می رسد دست کم درباره هفت چالش مورد بررسی در این پژوهش، با نادیده گرفتن این چالش ها در سامانه های بازیابی اطلاعات، اثربخشی بازیابی چندان متأثر نمی شود. مقدار کلی شاخص«ضریب درگیری» برابر با 033/0 به دست آمد که بیانگر انطباق نداشتن گسترده الگوی نگارشی نگارندگان با دستور خط مصوب فرهنگستان است. از دلایل این امر می توان به تمایل نگارندگان به ساده نگاری در اثر «اصل کمترین کوشش» و عدم احساس ضرورت رعایت رسم الخط مرسوم عربی توصیه شده در دستور خط مصوب فرهنگستان، اشاره کرد.  
۹۹.

بررسی عوامل واگرایی در نگارش وابستگی سازمانها و مراکز پژوهشی و تاثیر آن بر جامعیت نتایج بازیابی شده در پایگاه تامسون رویترز(مقاله علمی وزارت علوم)

کلیدواژه‌ها: واگرایی در نگارش جامعیت وابستگی سازمانی بازیابی اطلاعات پایگاه تامسون رویترز

حوزه های تخصصی:
تعداد بازدید : ۳۰۹ تعداد دانلود : ۲۹۲
هدف: پژوهش حاضر با هدف شناسایی عوامل واگرایی در نحوه نگارش نام سازمان ها و مراکز پژوهشی وابسته به وزارت علوم، تحقیقات و فناوری و تأثیر آن بر جامعیت نتایج بازیابی شده در پایگاه تامسون رویترز نوشته شده است. روش: این پژوهش از نوع کاربردی است و به روش پیمایشی انجام شده است. جامعه پژوهش را کلیه مدارک نمایه شده سازمان ها و مراکز پژوهشی وابسته به وزارت علوم، تحقیقات و فناوری طی سال های 2000 تا 2016 میلادی تشکیل می دهند. در مجموع 403 صورت نگارشی برای 25 سازمان بررسی شد. یافته ها: یافته های پژوهش نشان داد برای هر سازمان یا مرکز پژوهشی به طور میانگین 16 صورت نوشتاری مختلف وجود دارد. همچنین، سرنام، غلط املایی، اختصار، جابه جایی کلمات، فاصله گذاری، تغییر نام سازمان ها و رعایت نکردن الگوی واحد در نگارش، عمده دلایل واگرایی شمرده می شوند. علاوه بر این، در تمامی سازمان ها و مراکز پژوهشی، به استثنای دو مورد، واگرایی در نگارش وابستگی سازمانی بر روی جامعیت نتایج تأثیر منفی گذاشته است. نتیجه گیری: با توجه به آشفتگی و نبود وحدت رویّه مشاهده شده در درج وابستگی سازمانی و تأثیر منفی ای که این عامل بر  بازیابی نام  سازمان ها و مراکز پژوهشی و رتبه بندی آنها در نظام های رتبه بندی بین المللی و موارد جز آن می گذارد، انجام اقدام هایی با هدف یکدست ساختن وابستگی های سازمانی ضروری به نظر می رسد. در این راستا، تعیین وابستگی سازمانی استاندارد توسط سیاست گذاران هر سازمان و الزام پژوهشگران و نویسندگان به استفاده از وابستگی سازمانی ازپیش تعریف شده، مهم ترین راهکار پیشنهادی است.
۱۰۰.

بررسی موتورهای جستجوی کودکان از نظر امکانات جستجو، واسط کاربری و نمایش اطلاعات(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازیابی اطلاعات موتورهای جستجو کودکان

حوزه های تخصصی:
تعداد بازدید : ۲۸۹ تعداد دانلود : ۳۰۴
هدف: یکی از امکانات فراهم شده برای ایمن نگه داشتن کودکان در محیط آنلاین، به کار بردن ابزارهای جستجویی است که وب سایت ها را به منظور تناسب سنّی، غربالگری می کنند. هدف پژوهش حاضر، مقایسه و ارزیابی موتورهای جستجوی کودکان از نظر امکانات جستجو، واسط کاربری و نمایش اطلاعات است. روش پژوهش: پژوهش حاضر از نوع توصیفی است و با روش پیمایشی اجرا شده است. برای گردآوری داده ها از سیاهه وارسی محقق ساخته استفاده شده است. جامعه آماری این پژوهش شامل 19 موتور جستجوی مطرح مخصوص کودکان است که در متون به آنها اشاره شده است. یافته ها: یافته های پژوهش حاکی از آن است که موتورهای جستجوی Boolify و KidzSearch به میزان80% و موتورهای جستجوی Safe Search Kids با میزان 5/72 % بیشترین میزان همخوانی با معیارهای در نظر گرفته شده برای یک موتور جستجوی کودکان را دارا هستند. نتایج: نتایج نیز موتورهای جستجوی Boolify، KidzSearch، Safe Search Kids، KidRex و Kid's Search را مناسب ترین موتورهای جستجو برای کودکان ایرانی و فارسی زبان معرفی می کند.