سنجش میزان تکرار اطلاعات در بازیابی اطلاعات فارسی از وب با مقایسه موتورهای کاوش عمومی(مقاله علمی وزارت علوم)
حوزههای تخصصی:
هدف: پژوهش حاضر با هدف سنجش میزان تکرار اطلاعات بازیابی شده فارسی در وب و مقایسه موتورهای کاوش از لحاظ میزان توانمندی در بازیابی کمترین تکرار در محتوای نتایج انجام گرفت.
روش: این پژوهش، از دسته مطالعات توصیفی است که از روش های کمّی و آمار توصیفی بهره می گیرد و با توجه به مقایسه و ارزیابی موتورهای کاوش، در زمره تحقیقات ارزیابی نظام های بازیابی اطلاعات نیز محسوب می شود.
یافته ها: یافته ها نشان داد که موضوعاتی همچون حقوق، جغرافیا و ادبیات با بیش از 70 درصد تکرار در هر موتور کاوش، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری دارند. موتور کاوش گوگل با بازیابی تنها 8/42 درصد کمترین میزان و موتور کاوش بینگ با بازیابی 33/58 درصد، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری داشتند.