بهبود پیش بینی علاقه کاربران در کلان داده توییتر با استفاده از طبقه بند تجمعی(مقاله علمی وزارت علوم)
منبع:
رسانه سال ۳۵ تابستان ۱۴۰۳ شماره ۲ (پیاپی ۱۳۵)
105 - 129
حوزه های تخصصی:
در دنیای امروزی، شبکه های اجتماعی که بخشی از زندگی روزمره انسان ها شده اند، از جمله توییتر، تلگرام، اینستاگرام و غیره، روز به روز در حال افزایش و گسترش هستند. لذا تعداد کاربران آن ها نیز در حال افزایش است و در نتیجه، حجم داده زیادی در این شبکه ها در حال تبادل و ذخیره سازی است که این حجم عظیم داده، شبکه های اجتماعی به خصوص توییتر را تبدیل به کلان داده کرده است. مدیریت، سامان دهی و هرس کردن این کلان داده ها و همچنین، پیش بینی رفتار کاربران شبکه های اجتماعی امری بسیار مهم است. یکی از روش های مهم و تأثیرگذار برای پیش بینی علاقه کاربر در شبکه های اجتماعی، تکنیک های طبقه بندی است که در اغلب کاربردها و پژوهش های موجود در پیشینه تحقیق، هنوز در معیارهایی مانند دقت و صحت پیش بینی ضعف دارند. در این مقاله، به منظور پیش بینی علاقه کاربر در شبکه های اجتماعی توییتر، از روش طبقه بندی تجمعی مبتنی بر رأی گیری که دارای دو گام اساسی است، استفاده شده است. در گام نخست، با بهره گیری از الگوریتم های طبقه بندی پایه ای شامل نزدیک ترین همسایه، درخت تصمیم، جنگل تصادفی و بیزین ساده، خروجی های هر طبقه بندی حاصل می شوند. در گام دوم، خروجی نهایی طبقه بندی تجمعی با استفاده از روش رأی گیری محاسبه می شود. نتایج آزمایش ها بر روی مجموعه کلان داده های شبکه اجتماعی توییتر و براساس معیارهای دقت، صحت و پوشش، استدلال بر این دارد که روش پیشنهادی طبقه بندی تجمعی مبتنی بر رأی گیری، نتایج مطلوب تری را نسبت به الگوریتم های دیگر داشته است.