مطالب مرتبط با کلیدواژه

فارس نت


۱.

مشکلات انطباق دسته های هم معنای فارس نت با دسته های هم معنای وردنت پرینستون(مقاله علمی وزارت علوم)

نویسنده:

کلیدواژه‌ها: شبکه واژگانی وردنت پرینستون فارس نت انطباق اولیه انطباق ثانویه زبانشناسی رایانشی

حوزه‌های تخصصی:
تعداد بازدید : ۱۴۲۵ تعداد دانلود : ۷۸۸
در این پژوهش به بررسی مشکلات موجود در انتخاب معادل برای دسته های هم معنای (دسمعناهای) فارس نت پرداخته شد. اهمیت این پژوهش به این لحاظ است که نتایج آن می تواند در طرحهای آینده مربوط به تکمیل فارس نت و ساخت شبکه های واژگانی دیگر یا تخصصی مورد استفاده قرار گیرد. با توجه به وجود سه دسته از مشکلات جهت انطباق وردنتها بر همدیگر شامل الف. مشکلات ناشی از سختی در تمایز معنایی در وردنت مبدأ ب. مشکلات ناشی از اصول حاکم بر وردنت مبدأ و منابع زبان مقصد و ج. مشکلات ناشی از تفاوتهای ذاتی بین زبان مبدأ و مقصد، به تحلیل موارد یافت شده در فارس نت پرداخته شده است. این پژوهش سعی بر پاسخ به سوالات زیر داشته است: مشکلات موجود بر سر راه انطباق دسمعناهای فارس نت با وردنت چه می باشد؟ چه مشکلاتی بسامد بیشتری دارند؟ آیا تفاوتی بین مشکلات موجود در انطباق فارس نت با وردنت و انطباق در سایر وردنتهای موجود وجود دارد؟ حجم نمونه مورد بررسی که به شکل تصادفی انتخاب شده اند 1552 دسته می باشد که شامل دسمعناهایی است که اولین عضو آن ها با حروف >ع، غ، ف و ق< شروع شده اند. مشکلات یافته شده به هشت دسته تقسیم گردیدند و بسامد و درصد هر مشکل ارائه گردید و برای حل برخی از این مشکلات راههایی پیشنهاد شد. این راه حلها می تواند در فرایند تکمیل فارس نت و یا پیش از ساخت شبکه های واژگانی دیگر یا شبکه های واژگانی تخصصی مد نظر قرار گیرد.
۲.

مقایسة روابط معنایی درون زبانی اسامی در فارس نت، یورونت و وردنت پرینستون(مقاله علمی وزارت علوم)

نویسنده:

کلیدواژه‌ها: رابطة معنایی معناشناسی واژگانی شبکة واژگانی وردنت پرینستون فارس نت یورونت

حوزه‌های تخصصی:
  1. حوزه‌های تخصصی زبان شناسی زبان شناسی نظری ساخت واژه (صرف)/ واژگان شناسی
  2. حوزه‌های تخصصی زبان شناسی زبان شناسی نظری معنی شناسی
تعداد بازدید : ۱۶۰۴ تعداد دانلود : ۶۲۳
در این پژوهش، روابط معنایی درون زبانی اسامی در سه شبکة واژگانی فارس نت، یورونت و وردنت پرینستون را مقایسه کرده ایم. برای این منظور، ابتدا شبکة واژگانی و روابط موجود بین واحدهای سازندة آن و سپس روابط معنایی موجود بین دسته های هم معنای اسم در شبکة واژگانی را معرفی کردیم. در این پژوهش، می کوشیم به این سؤالات پاسخ دهیم که آیا تفاوتی ازلحاظ نوع و تعداد روابط بین این سه شبکة واژگانی وجود دارد و درصورت وجود تفاوت، علت آن چیست. پژوهش حاضر پژوهشی توصیفی-تطبیقی است و نتایج مقایسه نشان داد که با اینکه چند رابطة محدود استخوان بندی این سه شبکة واژگانی را شکل می دهند و بین این سه شبکه مشترک هستند، روابط دیگری وجود دارند که بر اطلاعات موجود بین دسته های هم معنا و درنتیجه بر قدرت و کارایی این ابزارها در پردازش زبان طبیعی می افزایند؛ هرچند بیش ازحد بودن آن ها خود به کاهش توانایی محاسباتی منجر می شود و به همین دلیل در فارس نت، تعداد روابط متعادل تر انتخاب شده است. یافته های این پژوهش در ساخت شبکه های واژگانی دیگر، ازجمله شبکه های واژگانی تخصصی، به کار می رود.
۳.

کاربرد مترادف ها در سرعنوان های موضوعی فارسی و اصطلاح نامه اصفا بر مبنای ابزار واژگانی فارس نت(مقاله علمی وزارت علوم)

کلیدواژه‌ها: روابط معنایی مترادف سرعنوان های موضوعی فارسی اصطلاح نامه فرهنگی فارسی (اصفا) فارس نت شباهت سنجی کسینوس شباهت

حوزه‌های تخصصی:
تعداد بازدید : ۱۹ تعداد دانلود : ۲۴
هدف: ترادف یا هم معنایی از ویژگی های مهم زبان های طبیعی است. ازآنجاکه یک مفهوم واحد ممکن است با دو یا چند شکل واژگانی بیان شود و معلوم نیست کدام شکل واژگانی بازگوکننده یک مفهوم واحد در سامانه بازیابی مورد جستجو قرار خواهد گرفت، سامانه باید بتواند از همه مترادف های یک مفهوم به مدرکی که مفهوم در آن موردبحث قرارگرفته ارجاع دهد. این پژوهش با هدف بررسی وضعیت به کارگیری مترادف های سرعنوان های گزیده/ اصطلاحات مرجح را در ساخت سرعنوان های ناگزیده/ اصطلاحات نامرجح در سرعنوان های موضوعی فارسی و اصطلاح نامه فرهنگی فارسی «اصفا»، در تطبیق با فارس نت، به عنوان منبع واژگانی جامع زبان فارسی، انجام شد.روش: پژوهش از حیث هدف کاربردی و از جنبه روش شناسی، تحلیل محتوا بود و از فنون متن کاوی و پردازش زبان طبیعی برای سنجش میزان کاربرد مترادف ها در هر دو واژگان کنترل شده با سنجش شباهت دو گروه داده استفاده کرده است. ۳۲۷۰ سرعنوان موضوعی و ۲۰۲۰ اصطلاح اصلی به صورت هدفمند از دو منبع سرعنوان های موضوعی فارسی و اصطلاح نامه اصفا، به عنوان دو مجموعه واژگان کنترل شده مورداستفاده در تدوین کتابشناسی ملی ایران، انتخاب شد. سرعنوان های ناگزیده، اصطلاحات نامرجح مربوط به هر سرعنوان/ اصطلاح اصلی و مترادف های هر یک از فارس نت نیز استخراج شد. پایایی با تکرار استخراج بخشی از سرعنوان ها/اصطلاحات توسط پژوهشگر دوم با شباهت ۶۱۸/۰ و ۷۰۶/۰ از بازه میان صفر تا ۱ به ترتیب برای سرعنوان ها و اصطلاحات به دست آمد. با استفاده از زبان برنامه نویسی پایتون شباهت میان هریک از دو دسته داده سرعنوان های ناگزیده و اصطلاحات نامرجح با مترادف های سرعنوان ها/ اصطلاحات اصلی مربوط به آن ها در فار س نت با سنجه کسینوس شباهت اندازه گیری شد.یافته ها: در نمونه گرفته شده از سرعنوان های موضوعی فارسی،2561 سرعنوان اصلی (78/3 درصد) دارای سرعنوان ناگزیده بوده اند که به سرعنوان گزیده ارجاع می دهد. 2316 سرعنوان اصلی (70/8 درصد) نیز دارای مترادف در فارس نت بوده اند. نمره شباهت میان سرعنوان های ناگزیده و مترادف های سرعنوان اصلی مربوط به هر یک ۱۲۵/۰ به دست آمد که نشان از شباهت پایین آن هاست. همچنین در نمونه گرفته شده از اصطلاح نامه اصفا، 545 اصطلاح (حدود 27 درصد) دارای اصطلاح ارجاعی نامرجح بوده اند. 1376 اصطلاح (68 درصد) از این اصطلاحات نیز دارای مترادف در فار س نت هستند؛ یعنی تعداد 1475 اصطلاح (73 درصد) فاقد اصطلاح نامرجح (که ارجاع به اصطلاح اصلی می دهند) بوده اند. نمره شباهت میان اصطلاحات نامرجح در اصطلاح نامه اصفا و مترادف های اصطلاح اصلی مربوط به هر یک 131/0 به دست آمد که نمره پایینی است. نتیجه گیری: در سرعنوان های موضوعی فارسی تقید بیشتری در ساخت و به کارگیری ارجاعات موضوعی دیده می شود، ولی در هر دو واژگان کنترل شده تعداد کمی از سرعنوان ها و اصطلاحات ارجاعی (ناگزیده و نامرجح) از میان مترادف های مفاهیم در زبان فارسی انتخاب شده اند. این پژوهش معرفی مترادف های عبارت ها را برای همه کاربران، ازجمله فهرست نویسان و متصدیان ساخت مستندات موضوعی، چه هنگام جستجوی مفاهیم و چه در ساخت اصطلاحات توصیه می کند، چراکه می تواند به بهبود وضعیت بانک های مستند موضوعی و درنهایت تجربه متکامل تر کاربر در جستجوی موضوعی و بازیابی منابع کمک کند.