ارائه چارچوبی جامع از ویژگی های مؤثر در تشخیص اخبار جعلی: یک مرور نظام مند (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
در سال های اخیر، با توسعه سریع و افزایش محبوبیت رسانه های اجتماعی، شاهد رشد گسترده ای در حجم و تنوع اخبار جعلی بوده ایم. این پدیده اثرات عمیقی بر روی افراد و جامعه دارد. راستی آزمایی روشی است که به طوری گسترده برای مقابله با اثرات منفی انتشار اخبار جعلی استفاده می شود. اما این روش هنگام تحلیل حجم عظیم اطلاعات کارآمد نیست. بنابراین از مدل های پیشرفته یادگیری ماشین و رویکردهای مبتنی بر ویژگی برای شناسایی خودکار اخبار جعلی استفاده می شود. در همان حال، تعداد زیاد مدل ها و ناهمگونی ویژگی های مورد استفاده در ادبیات، اغلب محدودیت هایی برای محققانی که سعی در بهبود عملکرد مدل دارند، ایجاد می کند. به همین دلیل، در مطالعه حاضر با روش مرور نظام مند، چارچوبی جامع از ویژگی هایی که در تشخیص اخبار جعلی استفاده می شوند، ارائه شده است. به منظور انجام این مرور نظام مند با استفاده از راهنمای ارائه شده توسط «اوکولی» و «اسچابرام»، کلیه مطالعات انجام گرفته در حوزه اخبار جعلی با استفاده از کلیدواژه های مرتبط، از پایگاه داده های ScienceDirect، Springer، Emerald، IEEE، ACM، Wiley، Sage، JSTOR، Taylor و WOS استخراج شد و سرانجام، تعداد 72 مقاله مرتبط مورد بررسی قرار گرفت. در نتیجه تحلیل مقالات مرتبط، ویژگی ها در دو طبقه اصلی محتوای خبر و زمینه خبر قرار گرفتند. محتوای خبر شامل ویژگی های زبانی و معنایی، ویژگی های بصری و ویژگی های مبتنی بر سبک هستند. زمینه خبر نیز شامل ویژگی های مبتنی بر کاربر، پست و شبکه است. نتایج به دست آمده نشان داد که پرکاربردترین ویژگی ها در تشخیص اخبار جعلی ویژگی های مبتنی بر پروفایل کاربر، ویژگی های سبک آماری، الگوی نوشتاری و خوانایی هستند. با توجه به تنوع بالای ویژگی های موجود پیشنهاد می شود ارزیابی گسترده ای از ویژگی ها، مدل ها و همچنین عملکرد آنها در مجموعه داده های متعدد انجام شود و از این طریق عملکرد مدل ها و مجموعه ویژگی های مختلف مقایسه شود تا بهترین ترکیب ویژگی در شرایط مختلف مشخص گردد.Presenting a Comprehensive Framework of Effective Features in Fake News Detection: a Systematic Review
Over recent years, with the rapid development and increasing popularity of social media, we have seen a massive growth in the volume and variety of fake news. This phenomenon has profound effects on individuals and society. Verification is a widely used method to counter the negative effects of fake news. But this method is not efficient when analyzing huge amount of data. Therefore, advanced machine learning models and feature-based approaches are used to automatically identify fake news. At the same time, the large number of models and the heterogeneity of features used in the literature often create limitations for researchers trying to improve model performance. For this reason, in the present study a comprehensive framework of the features used in the detection of fake news is presented with a systematic review method. In order to carry out this systematic review, using the guide provided by Okoli and Schabram, all studies conducted in the field of fake news using related keywords were taken from ScienceDirect, Springer, Emerald, IEEE, ACM, Wiley, Sage databases, JSTOR, Taylor and WOS and finally 72 related articles were analyzed. As a result of the analysis of related articles, the features were placed in two main categories of news content and news context. News content includes linguistic and semantic features, visual features and style-based features. The news context also includes features based on user, post and network. The obtained results showed that the most used features in detecting fake news are features based on user profile, features of statistical stylistic, writing pattern and readability. Due to the high variety of available features, it is suggested that a wide evaluation of features, models and their performance in multiple data sets should be done and in this way the performance of different models and feature sets should be compared in order to find the best combination of features in different conditions to be determined.