بهنام یوسفی مهر

بهنام یوسفی مهر

مطالب
ترتیب بر اساس: جدیدترینپربازدیدترین

فیلترهای جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۱ مورد از کل ۱ مورد.
۱.

تشخیص تقلب در بیمه خودرو با استفاده از خوشه بندی بهبود یافته با الگوریتم ژنتیک(مقاله علمی وزارت علوم)

کلیدواژه‌ها: الگوریتم ژنتیک بیمه خودرو تشخیص تقلب خوشه بندی هوش مصنوعی

حوزه‌های تخصصی:
تعداد بازدید : ۱۱ تعداد دانلود : ۱۲
پیشینه و اهداف: خوشه بندی یکی از روش های اساسی در داده کاوی و یادگیری ماشین است که برای تقسیم مجموعه ای از داده ها به زیرمجموعه های همگن به کار می رود. روش های مختلفی برای انجام خوشه بندی وجود دارد که هریک نقاط قوت و ضعف خاص خود را دارند. یکی از چالش های اصلی در خوشه بندی، یافتن تعداد خوشه های بهینه و تخصیص بهینه داده ها به این خوشه هاست. الگوریتم ژنتیک، به عنوان روش بهینه سازی مبتنی بر تکامل طبیعی، توانایی بالایی در حل مسائل پیچیده و جست وجوی فضای جواب های بزرگ دارد و می تواند به عنوان یک ابزار مؤثر در خوشه بندی به کار رود. هدف این مقاله، بررسی کارایی و دقت الگوریتم ژنتیک در کلاس بندی داده ها و مقایسه آن با روش های سنتی خوشه بندی برای کلاس بندی است. به منظور ارزیابی عملکرد این الگوریتم، چندین مجموعه داده بیمه استفاده شده و نتایج به دست آمده با معیارهای مختلفی مانند دقت تحلیل می شوند. همچنین، پارامترهای مختلف الگوریتم ژنتیک بررسی شده و تأثیر آن ها بر عملکرد نهایی الگوریتم مطالعه می شود تا بهینه ترین تنظیمات برای کلاس بندی داده ها تعیین شود. روش شناسی: در این پژوهش، به منظور تشکیل کروموزوم ها، ابتدا تعداد خوشه ها مشخص شد. با توجه به اینکه هر مرکز خوشه به اندازه تعداد ویژگی های مجموعه داده دارای ویژگی بود، طول هر کروموزوم به صورت حاصل ضرب تعداد خوشه ها در تعداد ویژگی ها تعیین شد. برای فرایندهایCrossover ،Mutation  و Survival از روش های نوین و متنوعی بهره گرفته شد. همچنین، معیار ارزیابی مشابه الگوریتم K-means انتخاب شد تا عملکرد خوشه بندی بهینه سازی شود. این رویکرد نوآورانه به بهبود دقت و کارایی فرایند کلاس بندی منجر شد. یافته ها: با اعمال روش توضیح داده شده در این مقاله برای تشخیص تقلب در ۳ مجموعه داده بیمه، به نتایج جالب توجهی با 12% بهبود در F1  و 10% افزایش دقت در مجموعه داده اول، 1% بهبود F1 و دقت در مجموعه داده دوم و در نهایت نیز 1% بهبود در F1 و 2% بهبود در دقت مجموعه داده سوم نسبت به روشK-means  و سایر روش ها حاصل شده است. با توجه به ۲ کلاس بودن داده ها در این مجموعه داده ها ، مسئله به ازای ۲ خوشه با استفاده از الگوریتم حل شده و بهترین برچسب برای هر خوشه با توجه به برچسب های واقعی دادگان انتخاب شده و نتیجه به صورت نتایج حاصل از مسائل دسته بندی ارائه شده است، همچنین بهبود چشمگیری در معیارهایی همچون ARI و سایر معیارهای ارزیابی خوشه بندی حاصل شده و پیشرفت چشمگیری نسبت به الگوریتم ژنتیک عادی نیز حاصل شده است. نتیجه گیری: الگوریتم ژنتیک قابلیت حل مسائل پیچیده و بدون راه حل قطعی را دارد و می تواند در خوشه بندی داده ها عملکرد بهتری نسبت به روش های سنتی مانندK-means  داشته باشد. این رویکرد با ترکیب احتمالات و تصادفی بودن، امکان بررسی نقاط بیشتر به عنوان مراکز خوشه و بهبود عملکرد خوشه بندی را فراهم می کند. نتایج نشان می دهد که این روش در برخی موارد بهتر از روش های معروف عمل می کند و ساختار مناسبی برای خوشه بندی داده ها ارائه می دهد.

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان