بهبود پیش بینی علاقه کاربران در کلان داده توییتر با استفاده از طبقه بند تجمعی (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
در دنیای امروزی، شبکه های اجتماعی که بخشی از زندگی روزمره انسان ها شده اند، از جمله توییتر، تلگرام، اینستاگرام و غیره، روز به روز در حال افزایش و گسترش هستند. لذا تعداد کاربران آن ها نیز در حال افزایش است و در نتیجه، حجم داده زیادی در این شبکه ها در حال تبادل و ذخیره سازی است که این حجم عظیم داده، شبکه های اجتماعی به خصوص توییتر را تبدیل به کلان داده کرده است. مدیریت، سامان دهی و هرس کردن این کلان داده ها و همچنین، پیش بینی رفتار کاربران شبکه های اجتماعی امری بسیار مهم است. یکی از روش های مهم و تأثیرگذار برای پیش بینی علاقه کاربر در شبکه های اجتماعی، تکنیک های طبقه بندی است که در اغلب کاربردها و پژوهش های موجود در پیشینه تحقیق، هنوز در معیارهایی مانند دقت و صحت پیش بینی ضعف دارند. در این مقاله، به منظور پیش بینی علاقه کاربر در شبکه های اجتماعی توییتر، از روش طبقه بندی تجمعی مبتنی بر رأی گیری که دارای دو گام اساسی است، استفاده شده است. در گام نخست، با بهره گیری از الگوریتم های طبقه بندی پایه ای شامل نزدیک ترین همسایه، درخت تصمیم، جنگل تصادفی و بیزین ساده، خروجی های هر طبقه بندی حاصل می شوند. در گام دوم، خروجی نهایی طبقه بندی تجمعی با استفاده از روش رأی گیری محاسبه می شود. نتایج آزمایش ها بر روی مجموعه کلان داده های شبکه اجتماعی توییتر و براساس معیارهای دقت، صحت و پوشش، استدلال بر این دارد که روش پیشنهادی طبقه بندی تجمعی مبتنی بر رأی گیری، نتایج مطلوب تری را نسبت به الگوریتم های دیگر داشته است.Improving User Relationship Prediction in Twitter Metadata Using Aggregate Classification
In today's world, social networks that have become a part of people's daily life, including Twitter, Telegram, Instagram, etc., are increasing and expanding day by day. Therefore, the number of their users is also increasing and as a result, a large amount of data is being exchanged and stored in these network; and this huge amount of data has turned social networks, especially Twitter, into big data. It is very important to manage, organize and prune these big data, as well as to predict the behavior of social network users.
One of the most important and effective methods for predicting user relationships in social networks is classification techniques, which in most of the applications and researches in the background of the research, are still based on criteria such as ‘accuracy; and accuracy of prediction. have weakness In this article, in order to predict the user relationship in Twitter social networks, the cumulative classification method based on voting, which has two basic steps, has been used. In the first step, by using basic classification algorithms including nearest neighbor, decision tree, random forest and simple Bayesian, the outputs of each classification are obtained. In the second step, the final output of cumulative classification is calculated using the voting method. The results of the experiments on the dataset of the Twitter social network and based on the criteria of accuracy, correctness and coverage, argue that the proposed cumulative classification method based on voting has more favorable results than It has other algorithms