ارزیابی عملکرد مدل های پایگاه داده در سیستم های شبکه های اجتماعی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
در این پژوهش مدل های داده محبوبترین شبکه های اجتماعی به همراه مزایا و معایب مربوط به آنها و همچنین مواردی که برای ذخیره سازی و بازیابی داده های شبکه های اجتماعی مهم و حائز اهمیت هستند بررسی و ارائه شده است. کاربردهای شبکه های اجتماعی در چند سال گذشته رشد چشمگیری داشته اند که نتیجه این رشد، تولید حجم زیادی داده می باشد. از طرفی ذخیره سازی و تجزیه و تحلیل داده های شبکه های اجتماعی برای انواع کسب و کارهای امروزه به طور موثر ضروری می باشند. انواع روش های ذخیره سازی رایج بر اساس مدل داده رابطه ای برای حجم بالای اطلاعات مقیاس پذیر نبوده و بنابراین بهینه و کارآمد نمی باشند. در نتیجه استفاده از روش های ذخیره سازی مبتنی بر مدل های غیررابطه ای به همراه مدل رابطه ای بسیار مرسوم شده اند. در این تحقیق، مجموعه داده حجیمی از داده های شبکه اجتماعی توییتر که شامل 15811468 توییت از پست های ارسالی توسط 300000 کاربر فارسی زبان این شبکه اجتماعی می باشد در سه پایگاه داده MySQL، MongoDB وRedis ذخیره شده و عملکرد هر یک از آنها با اجرای پرس وجوهای مختلف بررسی و مقایسه شده است. علاوه بر اندازه گیری زمان صرف شده برای اجرای عملیات بر روی داده ها، میزان فضای اشغال شده توسط پایگاه های داده نیز بررسی شدند. با توجه به مزایا و محدودیت های مرتبط با ساختار هر سه پایگاه داده، از مقادیر به دست آمده می توان نتیجه گرفت که اگر داده ها دارای ساختار مشخصی هستند، پایگاه داده رابطه ای مانند MySQL انتخاب خوبی است. اگر داده ها بدون ساختار و یا ساختاریافته با پتانسیل رشد سریع باشند، مدل های NoSQL کارایی بهتری خواهند داشت. ضمن اینکه نگهداری داده ها به صورت موقت و با سرعت زیاد در پایگاه های داده کلید- مقدار مانند Redis که داده ها را در حافظه نگهداری می کنند، مناسب تر هستند. همچنین از نظر زمان اجرا، MongoDB با صرف زمان کمتری در مقایسه با MySQL و Redis پرس و جوها را اجرا می کند که این اثباتی است بر اینکه پایگاه های داده NoSQL عملکرد و مقیاس پذیری بهتری را برای اکثر عملیات در مجموعه داده های بزرگ نشان می دهند.