ارزیابی عملکرد مدل های پایگاه داده در سیستم های شبکه های اجتماعی (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

نویسندگان: موژان صفایی نژاد سهیلا کرباسی

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره 39 زمستان 1402 شماره 2 (پیاپی 116)

کلیدواژه‌ها: شبکه های اجتماعی پایگاه داده مدل داده های بزرگ مقیاس پذیری

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

doi: 10.22034/jipm.2023.707244

شماره صفحات: ۶۲۷ - ۶۵۵

دریافت مقاله تعداد دانلود : ۱۷۲

آرشیو

چکیده

در این پژوهش مدل های داده محبوبترین شبکه های اجتماعی به همراه مزایا و معایب مربوط به آنها و همچنین مواردی که برای ذخیره سازی و بازیابی داده های شبکه های اجتماعی مهم و حائز اهمیت هستند بررسی و ارائه شده است. کاربردهای شبکه های اجتماعی در چند سال گذشته رشد چشمگیری داشته اند که نتیجه این رشد، تولید حجم زیادی داده می باشد. از طرفی ذخیره سازی و تجزیه و تحلیل داده های شبکه های اجتماعی برای انواع کسب و کارهای امروزه به طور موثر ضروری می باشند. انواع روش های ذخیره سازی رایج بر اساس مدل داده رابطه ای برای حجم بالای اطلاعات مقیاس پذیر نبوده و بنابراین بهینه و کارآمد نمی باشند. در نتیجه استفاده از روش های ذخیره سازی مبتنی بر مدل های غیررابطه ای به همراه مدل رابطه ای بسیار مرسوم شده اند. در این تحقیق، مجموعه داده حجیمی از داده های شبکه اجتماعی توییتر که شامل 15811468 توییت از پست های ارسالی توسط 300000 کاربر فارسی زبان این شبکه اجتماعی می باشد در سه پایگاه داده MySQL، MongoDB وRedis ذخیره شده و عملکرد هر یک از آنها با اجرای پرس وجوهای مختلف بررسی و مقایسه شده است. علاوه بر اندازه گیری زمان صرف شده برای اجرای عملیات بر روی داده ها، میزان فضای اشغال شده توسط پایگاه های داده نیز بررسی شدند. با توجه به مزایا و محدودیت های مرتبط با ساختار هر سه پایگاه داده، از مقادیر به دست آمده می توان نتیجه گرفت که اگر داده ها دارای ساختار مشخصی هستند، پایگاه داده رابطه ای مانند MySQL انتخاب خوبی است. اگر داده ها بدون ساختار و یا ساختاریافته با پتانسیل رشد سریع باشند، مدل های NoSQL کارایی بهتری خواهند داشت. ضمن اینکه نگهداری داده ها به صورت موقت و با سرعت زیاد در پایگاه های داده کلید- مقدار مانند Redis که داده ها را در حافظه نگهداری می کنند، مناسب تر هستند. همچنین از نظر زمان اجرا، MongoDB با صرف زمان کمتری در مقایسه با MySQL و Redis پرس و جوها را اجرا می کند که این اثباتی است بر اینکه پایگاه های داده NoSQL عملکرد و مقیاس پذیری بهتری را برای اکثر عملیات در مجموعه داده های بزرگ نشان می دهند.

Performance evaluation of database models in social network systems

In this research, the data models of widely used social networks, their advantages and disadvantages, as well as the things that need to be taken into account for storing and retrieving social network data, have been reviewed and presented. The usage of social networks has grown significantly in the past few years, and the result of this growth is the production of a large amount of data. On the other hand, it is necessary to effectively store and analyze social network data for all kinds of businesses today. The types of common storage methods based on the relational data model are not scalable for large amounts of information and therefore are not optimal and efficient. As a result, the use of storage methods based on non-relational models along with relational models have become very common. In this research, a large dataset of Twitter social network data, which includes 1,581,468 tweets from posts sent by 300,000 Persian users of this social network, is stored in three databases: MySQL, MongoDB, and Redis, and the performance of each of them with several different queries has been examined and compared. In addition to measuring the time spent to perform operations on the data, the amount of space occupied by the databases was also examined. Considering the advantages and limitations associated with the structure of all three databases, from the obtained values, it can be concluded that if the data has a specific structure, a relational database like MySQL is a good choice. If the data is unstructured or structured with the potential for rapid growth, NoSQL models will perform better. In addition, storing data temporarily and at high speed in key-value databases such as Redis, which store data in memory, are more suitable. Also, in terms of execution time, MongoDB executes queries very fast compared to MySQL and Redis, which is a proof that NoSQL databases show better performance and scalability for most operations in large datasets.