طراحی و تهیه دادگان برچسب خورده فارسی از اخبار مرتبط با همه گیری کووید-19 به منظور تشخیص اخبار جعلی(مقاله علمی وزارت علوم)
منبع:
زبان و زبان شناسی دوره ۱۹ پاییز و زمستان ۱۴۰۲ شماره ۳۷
173 - 192
حوزه های تخصصی:
در این مقاله یک پیکره برچسب خورده، به منظور به کارگیری در تشخیص اخبار جعلی با حدود 5000 پست مربوط به اخبار همه گیری کووید-19 از پیام رسان تلگرام استخراج شده و برچسب زنی می شود. فرایند ساخت پیکره در دو مرحله انجام می پذیرد. مرحله اول شامل جمع آوری و پیش پردازش داده ها و مرحله دوم شامل برچسب گذاری آنها می باشد. در مرحله اول، داده ها فیلتر می شوند و بعد از انجام پردازش های لازم برروی آنها، در مرحله دوم، بر اساس یک شیوه نامه، اقدام به برچسب گذاری می شود. در مرحله برچسب گذاری، از هفت عنوان موردنظر برای وظایف، استفاده می گردد و هر پست خبری با توجه به این هفت وظیفه برچسب گذاری می شود. ایجاد یک چهارچوب مناسب (شیوه نامه) برای برچسب زنی یکی از اقدامات مهم در این مرحله می باشد. شیوه نامه در اختیار دو برچسب زن خبره که بدین منظور آموزش دیده اند قرار می گیرد و اخبار از لحاظ هفت وظیفه 1) صحیح یا جعلی بودن 2) سیاسی بودن 3) بالا بردن سطح آگاهی عمومی، دادن روحیه یا دادن یک توصیه به خواننده 4) مطالب مربوط به دارو و درمان یا مراقبت های بهداشتی 5) آمار مرگ و میر 6) داشتن محتوای حاوی مطالب تنفرآمیز، سرزنش، عیب جویی، منفی بافی و 7) ارزش داشتن برای بررسی واقعیت، مورد بررسی قرار گرفته و بر این اساس، برچسب درست، نادرست یا خنثی می گیرند. در صورت عدم توافق بین دو برچسب زن، از برچسب زن سوم نظرخواهی می شود. برچسب دهی اخبار طوری انجام می گیرد که در نهایت، دسته های متوازنی در وظیفه صحیح یا جعلی بودن اخبار به دست آید.