الهام یلوه

الهام یلوه

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۲ مورد از کل ۲ مورد.
۱.

بهینه سازی سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی(مقاله علمی وزارت علوم)

تعداد بازدید : 612 تعداد دانلود : 107
پژوهش حاضر با هدف ارائه روشی برای سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی انجام شد. مجموعه داده های مربوط به پایان نامه ها و رساله ها شامل 2943 تحقیق به عنوان جامعه آماری در نظر گرفته شد. جمع آوری داده ها از مجموعه داده های مربوط به تحقیقات علمی که شامل 5000  پژوهش در قالب فایل اکسل بود، انجام شد. در این پژوهش پس از تبدیل داده ه ا به قالب ساخت یافت ه، با استفاده از اعمال پیش پردازش عملیات پردازش صورت گرفت. در مرحله پردازش از تکنیک خوشه بندی جهت ارائه الگوریتم پیشنهادی در راستای سازماندهی اسناد متنی فارسی بهره گرفته شد. این الگوریتم با بهبود الگوریتم K-means در جهت خوشه بندی اسناد ارائه شد. نتایج حاصل از ارزیابی نشان داد الگوریتم پیشنهادی بر اساس معیارهای خارجی نسبت به دو الگوریتم K-means و K-means++ در کیفیت خوشه بندی اسناد تأثیر مثبتی داشت. به طوری که تحقیقات هر رده تعیین شده در خوشه موضوعی مرتبط دارای توزیع یکنواختی شد، و منجر به حصول هدف پژوهش حاضر گردید. در جداول رده/ خوشه حاصل از دو الگوریتم K-means  و K-means++ توزیع غیریکنواخت تحقیقات در خوشه ها مشاهده شد. بنابراین، ارزیابی بر اساس معیار های داخلی متأثر از تراکم متفاوت خوشه ها و شباهت بین خوشه ای بود. حجم دیتاست نیز متأثر از راهکارهای پیشنهادی برای انتخاب دیتاست نهایی و فرایند پژوهش نبود، بنابراین الگوریتم پیشنهادی برای ابعاد بالای ویژگی نیز مناسب عمل می کند.
۲.

مروری نظام مند بر پژوهش های بهبود الگوریتم کا-میانه برای خوشه بندی داده ها(مقاله علمی وزارت علوم)

کلید واژه ها: خوشه بندی داده بهبود الگوریتم کا-میانه خوشه بندی مرور نظام مند

حوزه های تخصصی:
تعداد بازدید : 574 تعداد دانلود : 686
خوشه بندی به عنوان یک فرایند جهت شناخت ماهیت و ساختار داده ها در بسیاری از حوزه های علوم و فناوری های مرتبط با آن نقش مهمی در سازماندهی داده ها دارد. یکی از الگوریتم های پرکاربرد و ساده خوشه بندی، کا-میانه است. پژوهش حاضر با هدف مرور نظام مند تحقیقات در زمینه بهبود الگوریتم کا-میانه برای خوشه بندی داده ها صورت گرفته است. این پژوهش با یک راهبرد جدید بر مبنای کاستی های الگوریتم کا-میانه به بررسی تحقیقات انجام شده در این زمینه و نقش آن در سازماندهی داده ها در محدوده سال های ۲۰۱۰ تا ۲۰۲۰ می پردازد. برای این منظور میزان توجه پژوهشگران به رفع هر یک از کاستی های این الگوریتم برای بهبود طی سال های مزبور در قالب پرسش های پژوهش تدوین شده است. در این پژوهش با استفاده از استراتژی جست وجو، پالایش، و استخراج مقاله ها در نهایت، ۴۷ منبع مرتبط شناسایی و مورد بررسی قرار گرفت. یافته ها نشان داد که بیشترین تحقیقات صورت گرفته با غلبه بر کاستی حساس به مراکز خوشه اولیه در جهت بهبود الگوریتم کا-میانه انجام شده است. همچنین، از ۴۷ تحقیق مورد بررسی، الگوریتم بهبودیافته کا-میانه در ۳۵ تحقیق بر روی داده های غیرمتنی و در ۱۲ تحقیق بر روی داده های متنی اعمال شده است. سرانجام، نتیجه حاصل از بررسی ۶ تحقیق از تحقیقات صورت گرفته نشان داد که حجم داده ها رابطه ای مستقیم با عملکرد الگوریتم بهبودیافته کا-میانه دارد. به عبارت دیگر، این الگوریتم باید به نوعی اصلاح شود که با اعمال بر روی حجم متفاوت داده ها خوشه بندی کارآمد و دقیقی انجام دهد.

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان