آرشیو

آرشیو شماره ها:
۹۱

چکیده

هدف: پژوهش حاضر با هدف سنجش میزان تکرار اطلاعات بازیابی شده فارسی در وب و مقایسه موتورهای کاوش از لحاظ میزان توانمندی در بازیابی کمترین تکرار در محتوای نتایج انجام گرفت.    روش: این پژوهش، از دسته مطالعات توصیفی است که از روش های کمّی و آمار توصیفی بهره می گیرد و با توجه به مقایسه و ارزیابی موتورهای کاوش، در زمره تحقیقات ارزیابی نظام های بازیابی اطلاعات نیز محسوب می شود.     یافته ها: یافته ها نشان داد که موضوعاتی همچون حقوق، جغرافیا و ادبیات با بیش از 70 درصد تکرار در هر موتور کاوش، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری دارند. موتور کاوش گوگل با بازیابی تنها 8/42 درصد کمترین میزان و موتور کاوش بینگ با بازیابی 33/58 درصد، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری داشتند.

Duplicated Items in Persian Information Retrieved from the Web

Objective: This research was aimed to measure the number of duplicated items in Persian information retrieval from the Web, and to compare search engines' abilities in removing duplicated items from the results. Methodology: Quantitative methods And Descriptive Statistics And Evaluation of information retrieval systems. Findings: The findings showed that in subjects such as law, geography, literature there were more than 70% duplicated items in search results. Google retrieved the lowest number of duplicated items (42.8%) and Bing retrieved the highest number of duplicated items (58.3%).

تبلیغات