پژوهشنامه پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات سابق)

ارائه روش رده بندی تک رده ای برای شناسایی متون پژوهشی حوزه محیط زیست ایران با استفاده از ماشین بردار پشتیبان

دریافت فایل ارجاع: RIS (پژوهیار، EndNote ، ProCite ، Reference Manager) | BibTex

چکیده

رده بندی متون پژوهشی به منظور شناسایی و تحلیل عرضه و تقاضای پژوهشی در حوزه های مختلف علوم اهمیت ویژه ای دارد. در این میان رده بندی پژوهش های حوزه محیط زیست به دلیل اهمیت فراوان آن در کشور و نیز میان رشته ای بودن آن ضروری است. این پژوهش روش رده بندی تک رده ای متون پژوهشی این حوزه را با استفاده از ماشین بردار پشتیبان ارائه می دهد و به ارزیابی پارامترهای مهم تأثیرگذار در کیفیت این رده بندی می پردازد. نتایج نشان می دهد که استفاده از مجموعه داده هسته توصیفی در یادگیری مدل، کارایی بهتری نسبت به هسته محتوایی دارد. همچنین، استفاده از هسته چندجمله ای و وزن دهی دودویی واژه ها در ماتریس بردار ویژگی ها نتایج بهتری نسبت به حالت های معمول دیگر ارائه می کند. در این مطالعه، روش جدید وزن دهی با نام NG-TF معرفی و ارائه شده است که نتایج ارزیابی آن نسبت به روش های دیگر، به ویژه در معیار دقت، برتری قابل توجهی دارد. از این رو، می توان از این روش وزن دهی برای تعیین واژگان نماینده یک حوزه پژوهشی استفاده کرد.

تبلیغات

آرشیو

آرشیو شماره ها:
۹۸