کاربرد الگوریتم های یادگیری ماشین در متن کاوی با رویکرد آنالیز احساس(مقاله علمی وزارت علوم)
منبع:
مدیریت فناوری اطلاعات دوره ۱۰ تابستان ۱۳۹۷ شماره ۲
309 - 330
حوزه های تخصصی:
تخصیص نظرها و متن های منتشر شده کاربران در فضای مجازی به طبقاتی با احساسات مثبت یا منفی، در تحقیق های مربوط به متن کاوی اهمیت بسیار زیادی دارد. هدف این مقاله، استفاده و مقایسه روش های یادگیری ماشین در طبقه بندی متن های فارسی بر اساس احساسات کاربران فعال در فضای مجازی است. داده های پژوهش، مجموعه نظرهای منتشرشده درباره فیلم های ایرانی و خارجی در بازه زمانی 1392 تا 1395 در سایت های سینمایی و نقد فیلم فارسی زبان است. پیش از به کارگیری الگوریتم ها، فرایند پیش پردازش داده ها بر اساس تبدیل آنها به نویسه، حذف ایست واژه ها و تحلیل چند واژه ای انجام گرفت. برای طبقه بندی داده ها، الگوریتم های با نظارت نایوبیز، ماشین بردار پشتیبان و شبکه عصبی استفاده شد. براساس نتایج به دست آمده، در آزمون خارج از نمونه با وجود دقت عددی بیشتر الگوریتم نایوبیز بر شبکه عصبی و ماشین بردار پشتیبان بر نایوبیز، برتری آماری نایوبیز بر شبکه های عصبی و ماشین بردار پشتیبان بر نایوبیز اثبات نشد. با وجود این، نتایج تحقیق گویای برتری معنادار الگوریتم ماشین بردار پشتیبان بر شبکه های عصبی در دقت طبقه بندی در سطح اطمینان 5 درصد است.