سنجش میزان تکرار اطلاعات در بازیابی اطلاعات فارسی از وب با مقایسه موتورهای کاوش عمومی (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

نویسندگان: سمیرا گوهری لیلا مکتبی فرد حمیدرضا جمالی مهمویی

منبع: تحقیقات کتابداری و اطلاع رسانی دانشگاهی دوره 49 تابستان 1394 شماره 2

کلیدواژه‌ها: اینترنت بازیابی اطلاعات تکرار اطلاعات وب فارسی موتورهای کاوش

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

doi: 10.22059/jlib.2015.56985

شماره صفحات: ۲۳۹ - ۲۵۴

دریافت مقاله تعداد دانلود : ۱۶۶

آرشیو

چکیده

هدف: پژوهش حاضر با هدف سنجش میزان تکرار اطلاعات بازیابی شده فارسی در وب و مقایسه موتورهای کاوش از لحاظ میزان توانمندی در بازیابی کمترین تکرار در محتوای نتایج انجام گرفت. روش: این پژوهش، از دسته مطالعات توصیفی است که از روش های کمّی و آمار توصیفی بهره می گیرد و با توجه به مقایسه و ارزیابی موتورهای کاوش، در زمره تحقیقات ارزیابی نظام های بازیابی اطلاعات نیز محسوب می شود. یافته ها: یافته ها نشان داد که موضوعاتی همچون حقوق، جغرافیا و ادبیات با بیش از 70 درصد تکرار در هر موتور کاوش، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری دارند. موتور کاوش گوگل با بازیابی تنها 8/42 درصد کمترین میزان و موتور کاوش بینگ با بازیابی 33/58 درصد، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری داشتند.

Duplicated Items in Persian Information Retrieved from the Web

Objective: This research was aimed to measure the number of duplicated items in Persian information retrieval from the Web, and to compare search engines' abilities in removing duplicated items from the results. Methodology: Quantitative methods And Descriptive Statistics And Evaluation of information retrieval systems. Findings: The findings showed that in subjects such as law, geography, literature there were more than 70% duplicated items in search results. Google retrieved the lowest number of duplicated items (42.8%) and Bing retrieved the highest number of duplicated items (58.3%).