تحلیل توزیع و تمرکز کلیدواژه های پارساها: میزان تطابق با توصیفگرها، عنوان، و چکیده (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

درجه علمی در دسته‌بندی سابق وزارت علوم: علمی-پژوهشی

نویسندگان: اشکان خطیر سهیل گنجه فر

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره 34 پاییز 1397 شماره 1 (پیاپی 95)

کلید واژه ها: نمایه سازی کلیدواژه توصیفگر توزیع کلیدواژه تمرکز فعالیت پژوهشی

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

شماره صفحات: ۴۱۱-۴۲۸

دریافت مقاله تعداد دانلود : ۳۹۰

آرشیو

چکیده

نمایه ها و چکیده های یک متن، خلاصه ای از متن را در اختیار خواننده قرار می دهند، لذا می توان از آن ها برای درک سریع و بازیابی سند استفاده کرد. ازآنجاکه بخش عمده ای از فعالیت های علمی فارسی در کشور ایران را پارسا ها تشکیل می دهند، در این پژوهش نمایه سازی پارسا ها از دو دیدگاه نویسنده پارسا و نمایه ساز حرفه ای موردبررسی قرار خواهد گرفت. سپس این نمایه ها با عنوان پارساها موردبررسی قرار می گیرد تا میزان انطباق با کلیدواژه های عنوانی به دست آید. از سوی دیگر با بررسی کلی مجموعه ای از نمایه ها و چکیده ها علاوه بر قابلیت بهبود در بازیابی اطلاعات برای محقق حوزه فعالیتی که بیشتر اسناد بر روی آن تمرکز کرده اند مشخص می شود.علاوه بر آن در این پژوهش وجود نمایه ها و توزیع آن ها در چکیده، بررسی می شوند. از توزیع کلیدواژه ها در چکیده می توان در استخراج خودکار کلیدواژه ها از چکیده پارساها در کارهای آتی استفاده شود. این پژوهش بر روی پارسا های موجود در پایگاه داده پژوهشگاه علوم و فناوری اطلاعات ایران که منبع گردآوری پارسا های فارسی است انجام شده است. روش پژوهش به این صورت است که بعد از گرداوری داده ها، پارسا هایی که اطلاعات کافی ندارند پالایه شده و مابقی پارسا ها توسط برنامه ای که برای پردازش متن چکیده و نمایه های پارسا ها نوشته ایم مورد تحلیل قرار خواهند گرفت. سپس اطلاعات بدست آمده با استفاده از آمار توصیفی شرح داده خواهند شد. بررسی انجام شده در این پژوهش نشان داده است عموماً نمایه های انتخاب شده (بیش از 60%) توسط نویسنده و نمایه ساز حرفه ای از 40% ابتدایی چکیده انتخاب شده اند. دیگر تحلیل های آماری این پژوهش نشان می دهند که میزان انطباق بین توصیفگرها و کلیدواژه ها 8% است. این اختلاف نشان دهنده میزان تفاوت نظر زیاد بین نویسندگان پارسا ها و نمایه سازان است. با بهره گیری از این اختلاف و با تجمیع کلمات و غنی کردن کلیدواژه های سیستم بازیابی اطلاعات می توان در بهبود بازیابی اطلاعات نیز استفاده کرد.