شناسایی هیجان در متن فارسی با استفاده از مدل یادگیری ماشینی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
پژوهش حاضر به منظور ارائه ی یک مدل محاسباتی برای بازشناسی هیجان در متن فارسی صورت گرفته است. در مدل پیشنهادی تحقیق، گروه بندی هشت گانه ی پلاچیک در هیجان ها به عنوان مبنای یادگیری نظارت شده، ویژگی های بافتی متن فارسی و لیست واژگان هیجانی برچسب دار به عنوان عناصر و اجزای مدل تعیین شده اند. برای آزمون مدل (شرایط واقعی) از صد متن منتخب شامل سرمقاله ی روزنامه های سیاسی- اجتماعی استفاده شده است. همچنین در این تحقیق از الگوریتم «ماشین بردار پشتیبان» به عنوان طبقه بند یادگیرنده استفاده گردیده و چهار شاخص دقت، درستی، ضریب f و بازخوانی برای ارزیابی مدل بکار گرفته شده اند. نتایج تحقیق نشان می دهند که کارایی مدل (دقت) در شناسایی هیجان های مختلف از 79 درصد تا 98 درصد متغیر بوده و در ارزیابی کلی مدل، میانگین دقت مدل معادل 84 درصد است. بر اساس سایر شاخص ها، می توان گفت که بیشترین نرخ درستی مربوط به هیجان خوشی و کمترین آن مربوط به هیجان خشم است. همچنین تطبیق قابل توجهی میان شاخص f با شاخص «بازخوانی» وجود دارد و بیشترین مقدار آن در گروه هیجان شادی دیده می شود. نتایج این تحقیق نشان می دهد استفاده از رهیافت مبتنی بر گروه بندی هیجان ها، یادگیری نظارت شده و نیز ویژگی های بافتی حداقلی در متن می تواند کارایی مناسبی در شناسایی خودکار هیجان ها داشته و می توان تلفیقی از گروه های اصلی هیجان را به منظور افزایش کارایی مدل یادگیری بکار گرفت.