آرشیو

آرشیو شماره‌ها:
۱۱۸

چکیده

هدف: ترادف یا هم معنایی از ویژگی های مهم زبان های طبیعی است. ازآنجاکه یک مفهوم واحد ممکن است با دو یا چند شکل واژگانی بیان شود و معلوم نیست کدام شکل واژگانی بازگوکننده یک مفهوم واحد در سامانه بازیابی مورد جستجو قرار خواهد گرفت، سامانه باید بتواند از همه مترادف های یک مفهوم به مدرکی که مفهوم در آن موردبحث قرارگرفته ارجاع دهد. این پژوهش با هدف بررسی وضعیت به کارگیری مترادف های سرعنوان های گزیده/ اصطلاحات مرجح را در ساخت سرعنوان های ناگزیده/ اصطلاحات نامرجح در سرعنوان های موضوعی فارسی و اصطلاح نامه فرهنگی فارسی «اصفا»، در تطبیق با فارس نت، به عنوان منبع واژگانی جامع زبان فارسی، انجام شد.روش: پژوهش از حیث هدف کاربردی و از جنبه روش شناسی، تحلیل محتوا بود و از فنون متن کاوی و پردازش زبان طبیعی برای سنجش میزان کاربرد مترادف ها در هر دو واژگان کنترل شده با سنجش شباهت دو گروه داده استفاده کرده است. ۳۲۷۰ سرعنوان موضوعی و ۲۰۲۰ اصطلاح اصلی به صورت هدفمند از دو منبع سرعنوان های موضوعی فارسی و اصطلاح نامه اصفا، به عنوان دو مجموعه واژگان کنترل شده مورداستفاده در تدوین کتابشناسی ملی ایران، انتخاب شد. سرعنوان های ناگزیده، اصطلاحات نامرجح مربوط به هر سرعنوان/ اصطلاح اصلی و مترادف های هر یک از فارس نت نیز استخراج شد. پایایی با تکرار استخراج بخشی از سرعنوان ها/اصطلاحات توسط پژوهشگر دوم با شباهت ۶۱۸/۰ و ۷۰۶/۰ از بازه میان صفر تا ۱ به ترتیب برای سرعنوان ها و اصطلاحات به دست آمد. با استفاده از زبان برنامه نویسی پایتون شباهت میان هریک از دو دسته داده سرعنوان های ناگزیده و اصطلاحات نامرجح با مترادف های سرعنوان ها/ اصطلاحات اصلی مربوط به آن ها در فار س نت با سنجه کسینوس شباهت اندازه گیری شد.یافته ها: در نمونه گرفته شده از سرعنوان های موضوعی فارسی،2561 سرعنوان اصلی (78/3 درصد) دارای سرعنوان ناگزیده بوده اند که به سرعنوان گزیده ارجاع می دهد. 2316 سرعنوان اصلی (70/8 درصد) نیز دارای مترادف در فارس نت بوده اند. نمره شباهت میان سرعنوان های ناگزیده و مترادف های سرعنوان اصلی مربوط به هر یک ۱۲۵/۰ به دست آمد که نشان از شباهت پایین آن هاست. همچنین در نمونه گرفته شده از اصطلاح نامه اصفا، 545 اصطلاح (حدود 27 درصد) دارای اصطلاح ارجاعی نامرجح بوده اند. 1376 اصطلاح (68 درصد) از این اصطلاحات نیز دارای مترادف در فار س نت هستند؛ یعنی تعداد 1475 اصطلاح (73 درصد) فاقد اصطلاح نامرجح (که ارجاع به اصطلاح اصلی می دهند) بوده اند. نمره شباهت میان اصطلاحات نامرجح در اصطلاح نامه اصفا و مترادف های اصطلاح اصلی مربوط به هر یک 131/0 به دست آمد که نمره پایینی است. نتیجه گیری: در سرعنوان های موضوعی فارسی تقید بیشتری در ساخت و به کارگیری ارجاعات موضوعی دیده می شود، ولی در هر دو واژگان کنترل شده تعداد کمی از سرعنوان ها و اصطلاحات ارجاعی (ناگزیده و نامرجح) از میان مترادف های مفاهیم در زبان فارسی انتخاب شده اند. این پژوهش معرفی مترادف های عبارت ها را برای همه کاربران، ازجمله فهرست نویسان و متصدیان ساخت مستندات موضوعی، چه هنگام جستجوی مفاهیم و چه در ساخت اصطلاحات توصیه می کند، چراکه می تواند به بهبود وضعیت بانک های مستند موضوعی و درنهایت تجربه متکامل تر کاربر در جستجوی موضوعی و بازیابی منابع کمک کند.

The Use of Synonyms in Persian Subject Headings and Asfa Thesaurus Based on Farsnet Lexical Tool

Purpose: Synonymy is one of the important features of natural languages. Since a single concept may be expressed by two or more lexical forms, and it is not predictable which lexical form of a single concept will be searched for, the retrieval system must be able to refer from all synonyms of the same idea to the document in which the concept is discussed. This research aimed to investigate the use of synonyms in non-preferred headings/ terms in Persian subject headings and Asfa Thesaurus, using Farsentas a comprehensive lexical source of the Persian language.Method: This was an applied research in terms of its goals, and used content analysis as a general methodology, specifically Natural Language Processing techniques and tools to measure the extent to which synonyms are used to build non-preferred headings/ terms in both controlled vocabulary, by measuring the similarity of the two groups of data. 3270 main subject headings and 2020 main thesaurus terms were selected, in a purposive sampling procedure, from Persian Subject Headings, and Asfa Thesaurus, as two controlled vocabulary used in the process of compiling the Iran National Bibliography. Non-preferred headings/ terms related to each main heading/ term, as well as synonyms of each, were also extracted from Farsent. Reliability was obtained by repeating the extraction of a part of the headings/ terms by a second researcher with a score of 0.618 and 0.706 between zero and 1 respectively. The similarity between the two data sets of non-preferred headings/terms with the synonyms of main headings/ terms related to them in Farsnet was measured using Cosine Similarity.Findings: In the sample taken from Persian subject headings, 2561 main subject headings (78.3%) have non-preferred headings that refer to them. 2316 main subject headings (70.8%) also have synonyms in Farsent. The similarity score between non-preferred headings and synonyms of the corresponding main headings was 0.125, thus very low. Also, in the sample taken from Asfa, 545 main terms in Asfa (about 27%) have non-preferred terms. 1376 terms (68%) of these main terms also have synonyms in Farsnet. Thus, 1475 main terms (73%) do not have non-preferred terms (which refer to the main term). The similarity score between non-preferred terms in the Asfa Thesaurus and the synonyms of the corresponding main terms was 0.131, very low as well.Conclusion: More commitment to the construction and use of subject references in the form of non-preferred headings is observable in Persian Subject Headings, but a small number of referential headings and terms (non-preferred) have been selected from among the synonyms of main subjects/terms in the Persian language. This research recommends the introduction of synonyms of terms for all users, including catalogers and those involved in the creation of controlled vocabularies, both during the search for concepts and in the creation of terms, because it can be a step towards improving subject authority databases and, ultimately, a more exhaustive user subject search and retrieval experience.

تبلیغات