مطالب مرتبط با کلیدواژه

پراکندگی داده ها


۱.

تحلیل همپوشانی عناصر واسط در بازنمایی اسناد متنی: مطالعه ای به روش الگوریتم «RAKE»(مقاله علمی وزارت علوم)

کلیدواژه‌ها: اسناد متنی استخراج کلیدواژه همپوشانی کلیدواژه بازنمایی اسناد پراکندگی داده ها

حوزه‌های تخصصی:
تعداد بازدید : ۲ تعداد دانلود : ۱
هدف: پژوهش حاضر با هدف بررسی میزان همپوشانی کلیدواژه های استخراج شده از عناصر واسط در بازنمایی اسناد متنی با استفاده از الگوریتم «Rake» انجام شد.روش: در این پژوهش، با استفاده از الگوریتم «Rake» کلیدواژه های مجموعه داده ای شامل 500 مقاله علمی در پنج گروه موضوعی مختلف استخراج شد. سپس همپوشانی بین کلیدواژه های عنوان، چکیده و کلیدواژه های نویسندگان موردبررسی قرار گرفت.یافته ها: نتایج نشان داد که همپوشانی بین کلیدواژه های عنوان و کلیدواژه های نویسندگان حدود 45 درصد و همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان حدود 18 درصد بود. در ادامه مشاهده شد که کلیدواژه های عنوان دارای پوشش 22 درصدی کلیدواژه های چکیده بودند. نتایج همچنین نشان داد که همپوشانی و پراکندگی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان و نیز بین کلیدواژه های چکیده و کلیدواژه های عنوان به طور متوازن و تقریباً یکسان بود؛ اما مشاهده شد که کلیدواژه های عنوان و کلیدواژه های نویسندگان دارای پراکندگی بیشتری بودند؛ که نشان دهنده احتمال همپوشانی بیشتر بین کلیدواژه های عنوان و کلیدواژه های نویسنده یک مقاله در مقایسه با کلیدواژه های چکیده و کلیدواژه های نویسنده و همچنین کلیدواژه های چکیده و کلیدواژه های عنوان است. بعلاوه درک خوبی از مفاهیم و مباحث حوزه پژوهشی در رشته های روانشناسی و مدیریت دولتی وجود داشت، درحالی که در رشته های فناوری اطلاعات و حقوق عمومی نیاز به بهبود و تقویت درک مفاهیم مشاهده شد. میزان همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان در پنج گروه موضوعی حدود 20 درصد بود.نتیجه گیری: استفاده مناسب از کلیدواژه ها، نوشتن چکیده هایی با محتوای هماهنگ با موضوع موردنظر و انتخاب عناوین متناسب می تواند به بهبود فرایند استخراج مفاهیم، ذخیره سازی و بازیابی مقالات علمی کمک کند، ازجمله اینکه کلیدواژه ها، چکیده ها و عناوین می توانند به عنوان ورودی برای الگوریتم های استخراج مفاهیم، همچنین به عنوان بخش هایی از ساختار ذخیره سازی اطلاعات در سرعت دسترسی کاربران به اطلاعات موردنیازشان و به عنوان ورودی برای الگوریتم های بازیابی اطلاعات برای دسترسی سریع به مقالات مرتبط کمک بسزایی داشته باشند.