سنجش میزان ربط تصاویر بازیابی شده در موتورهای کاوش مبتنی بر ویژگی های نگارشی زبان فارسی (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
این پژوهش با هدف بررسی تصاویر بازیابی شده از موتورهای کاوش برگزیده طبق ویژگی های نوشتاری و معنایی زبان فارسی و تعیین میزان ربط آن ها با استفاده از فرمول های جامعیت و دقت و نیز شناسایی کارآمدترین موتورکاوش در بازیابی تصاویر به زبان فارسی و به روش پیمایشی - تحلیلی و با استفاده از شیوه مشاهده مستقیم انجام گرفت. پس از مرور پژوهش های مرتبط، کلیدواژه های کاوش در قالب یک سیاهه بر اساس ویژگی های نوشتاری و معنایی زبان فارسی شکل گرفت. هر یک از این کلیدواژه ها در موتورهای کاوش مورد مطالعه شامل دو موتورکاوش معمولی گوگل و بینگ و موتور کاوش معنایی داک داک گو که در زمرهء موتورهای کاوش پراستفاده هستند و قابلیت جستجوی تصاویر به زبان فارسی را نیز فراهم نموده اند، جستجو و تعداد نتایج بازیابی شده مرتبط و غیر مرتبط ثبت گردید. سپس جامعیت و دقت نتایج جستجو در هر موتور کاوش محاسبه و به بررسی میزان ربط تصاویر بر اساس این ویژگی ها در هر یک از موتورهای کاوش مورد مطالعه پرداخته شد. برای تجزیه و تحلیل داده ها از انواع فنون آماری توصیفی به همراه آزمون کلموگروف-اسمیرنوف، شاپیرو-ویلک، کروسکال-والیس و فریدمن استفاده شد. یافته های پژوهش نشان داد موتورهای کاوش مورد مطالعه نسبت به ویژگی های نوشتاری و معنایی زبان فارسی توجه کافی ندارند و بسیاری از این ویژگی ها را در هنگام جستجو و بازیابی تصاویر نادیده می گیرند. در پژوهش حاضر، موتور کاوش گوگل از جامعیت و دقت بالاتری نسبت به دو موتور کاوش دیگر برخوردار بود و علیرغم ادعای موتورهای کاوش معنایی مبنی بر فراهم آوری اطلاعات با کیفیت تر و مرتبط تر نسبت به دیگر موتورهای جستجو، موتور کاوش داک داک گو عملکرد مطلوبی در زمینه بازیابی تصاویرمرتبط با بخش نوشتاری و معنایی زبان فارسی از خود نشان نداد. همچنین بین میزان جامعیت و دقت سه موتور کاوش مورد پژوهش اختلاف معناداری وجود دارد.Measuring the relevance of retrieved images in search engines based on Persian language writing styles
The aim of this study was to investigate the image retrieval from selected search engines according to the written and semantic features of Persian language and determine their relevance using recall and precision formulas and to identify the most efficient search engine in retrieving images in Persian and by survey-analytical method. It was done using direct observation technique. After reviewing related researches, search keywords list was formed in the form of a checklist based on the written and semantic features of Persian language. Each of these keywords in the studied search engines, including two general search engines Google and Bing and Duckduckgo semantic search engine, which are among the most used search engines and have also provided the ability to search for images in Persian, search and the number of relevant and unrelated retrieved results were recorded. Then, the recall and precision of search results in each search engine were calculated and the relevance of images based on these features in each of the studied search engines was investigated. A variety of descriptive statistical techniques were applied to analyze the data along with Kolmogorov-Smirnov, Shapiro-Wilk, Kruskal-Wallis and Friedman tests. Findings demonstrated that Google, Bing and Duckduckgo search engines do not pay enough attention to the written and semantic features of Persian language and many of these features are ignored while searching and retrieving images. In the present study, Google search engine had a higher recall and precision than the other two search engines, and despite the claim of semantic search engines to provide better and more relevant information than other search engines, Duckduckgo search engine did not show good performance in retrieving images related to the written and semantic part of Persian language. There is also a significant difference between the recall and the precision of the three studied search engines.