مطالب مرتبط با کلیدواژه

انتخاب ویژگی


۱.

به کارگیری یک درخت رگرسیونی هرس شده جهت انتخاب ویژگی های موثر بر پیش بینی رفتار خرید مشتریان در صنعت بیمه

کلیدواژه‌ها: مدیریت ارتباط با مشتری انتخاب ویژگی درخت تصمیم رگرسیونی پیش بینی رفتار خرید تشخیص مشتری

حوزه های تخصصی:
تعداد بازدید : ۱۱۰۰ تعداد دانلود : ۵۸۱
از مهم ترین ابعاد مدیریت ارتباط با مشتری، کشف الگوی رفتاری خرید مشتری است؛ سازمان می تواند با تعریف استراتژی های بازاریابی دقیق تر جهت جذب مشتریان مشابه اقدام کند. لذا، انتخاب ویژگی های موثر بر روی الگوی رفتاری خرید مشتریان با اهمیت است. زیرا استفاده از ویژگی های نامرتبط منجر می شود سازمان ناخواسته هزینه های بسیاری را صرف افرادی کند که احتمال خرید آنها ناچیز است. این تحقیق، یک رویه جدید برای شناسایی ویژگی های موثر جهت بهبود پیش بینی مشتریان ارائه می دهد. همچنین یک سیستم تشخیص مشتری مبتنی بر تکنیک غیرخطی درخت تصمیم رگرسیونی جهت انتخاب ویژگی ها و پیش بینی رفتار خرید مشتریان طی دو مرحله توسعه داده می شود. چون شناسایی مشتریان از موضوعات حیاتی صنعت بیمه است، از مجموعه داده های یک شرکت بیمه هلندی برای پیش بینی خرید یکی از محصولات آن استفاده شده است. نتایج نشان می دهد که انتخاب بهترین زیرمجموعه از ویژگی ها با به کارگیری یک درخت رگرسیونی هرس شده علاوه بر کاهش معنا دار پیچیدگی محاسبات می تواند بهبود قابل توجهی را در نتایج پیش بینی ایجاد کند.
۲.

روشی نو برای انتخاب ویژگیهای بهینه و افزایش قدرت تفکیک مکانی در نتایج طبقه بندی تصاویر پلاریمتری راداری(مقاله علمی وزارت علوم)

کلیدواژه‌ها: انتخاب ویژگی استخراج ویژگی تصاویر پلاریمتری راداری فضای پدیده طبقه بندی نرم SRM جا به جایی پیکسلی

حوزه های تخصصی:
تعداد بازدید : ۲۰۷۹ تعداد دانلود : ۱۰۰۲
استفاده از داده های پلاریمتری راداری نقش تعیین کننده ای در شناسایی اهداف زمینی دارد و اطلاعات جامعی در مورد ویژگیهای هندسی و همچنین ماهیت اهداف، با بهره گیری از این نوع داده ها استخراج شدنی است. از جمله مشکلات موجود در زمینه طبقه بندی این نوع داده ها، انتخاب ویژگیهای بهینه است. با توجه به اهمیت این موضوع، در تحقیق حاضر روشی نو براساس نگاشت ویژگیهای استخراج شده به فضای پدیده ارائه شده است. به عنوان یکی از نتایج تحقیق، شاخص بهینگی در فضای پدیده برای انتخاب ویژگیهای بهینه تصاویر پلاریمتری راداری ارائه گردید. از طرف دیگر، یکی از محدودیت های موجود در زمینه استخراج اطلاعات دقیق مکانی، اختلاط مکانیسم های بازپراکنش در سطح پیکسل است. بنابراین، استفاده از طبقه بندیکننده های نرم به منظور تجزیه این نوع اختلاط ها ضروری است. اینکه تضمینی برای منفی نشدن سهم کلاس ها و همچنین واحد شدن مجموع سهم کلاس ها در هر پیکسل وجود ندارد، خود از چالش های طبقه بندیکننده های نرم است، که در این تحقیق با تلفیق طبقه بندیکننده نرم و الگوریتم نظارت نشده استخراج عناصر خالص مرتفع گردید. طبقه بندی کننده های نرم به رغم افزایش اطلاعات ماهیتی در نتایج طبقه بندی، توان جانمایی کلاس ها را در سطح زیرپیکسل ندارند و فقط سهم تعلق کلاس ها را در هر پیکسل تعیین میکنند. بدین منظور الگوریتم های (SRM) Super Resolution Mapping برای افزایش قدرت تفکیک مکانی در سطح نتایج طبقه بندی نرم شکل گرفته و پرورده شده اند. در این تحقیق نیز از روش جابه جایی پیکسلی به منظور تهیه نقشه در سطح زیرپیکسل استفاده شده و فرایندی غیرتصادفی برای جانمایی اولیه زیرپیکسل ها ارائه گردیده است. براساس نتایج تحقیق، روش پیشنهادی برای انتخاب ویژگیهای بهینه در مقایسه با روش مبتنی بر الگوریتم ژنتیک نتایج بهتری را به دست داد. در ادامه با استفاده از ویژگیهای به دست آمده، سه الگوریتم تجزیه اختلاط طیفی خطی (LSU)، شبکه عصبی چندلایه (MLP)) و ماشین بردار پشتیبان (SVM) برای طبقه بندی نرم منطقه مطالعاتی در سه کلاس مسکونی، پوشش گیاهی و زمین بایر اعمال گردید. با ارزیابی آنها، SVM به عنوان طبقه بندیکننده بهینه شناسایی شد و نتایج آن در فرایند جانمایی کلاس ها در سطح زیرپیکسل به کار رفت. در نهایت با پیاده سازی الگوریتم جابه جایی پیکسلی، تصاویر پلاریمتری راداری در سطح زیرپیکسل طبقه بندی شدند و قدرت تفکیک مکانی نتایج طبقه بندی نرم بهبود یافت.
۳.

پیش بینی قیمت سهام با استفاده از شبکه عصبی فازی مبتنی برالگوریتم ژنتیک و مقایسه با شبکه عصبی فازی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: الگوریتم ژنتیک انتخاب ویژگی شبکه عصبی فازی پیش بینی قیمت سهام

حوزه های تخصصی:
تعداد بازدید : ۱۱۰۰ تعداد دانلود : ۸۴۷
در بازارهای سرمایه عامل های مختلفی در پیش بینی قیمت سهام موثر می باشد بنابراین سرمایه گذار جهت سرمایه گذاری سودآور با کمترین ریسک با چالش، تردید و خطا مواجه می باشد. در راستای کاهش هزینه و بالا بردن سود سرمایه گذاری، تعیین عاملهای تاثیر گذار و زمان مناسب جهت خرید و فروش از مهم ترین مسائلی است که هر سهام دار یا سرمایه گذار در بازار بورس بایستی به آن توجه ویژه داشته باشد. تاکنون روشهای مختلفی جهت نیل به این اهداف معرفی شده اند که اغلب روشهای آماری، هوشمند و ترکیبی هستند. الگوریتم پیشنهادی یک روش ترکیبی است که شامل دو بخش است بخش اول پیش پردازش و بخش دوم پیش بینی کننده است. در پیش پردازش سه فرآیند جاگذاری داده های غیر موجود، نرمالیزه کردن و انتخاب ویژگی به ترتیب انجام می شود. از آنجایی که تعداد ویژگی های بکار برده شده زیاد است از روش الگوریتم ژنتیک برای انتخاب ویژگی و کاهش ابعاد فضای ویژگی استفاده شده است. در بخش پیش بینی کننده، با توجه به قابلیت پیش بینی هوشمند شبکه عصبی - فازی، از این شبکه با دو ساختار ممدانی و سوگنو بعنوان پیش بینی کننده قیمت سهام بهره می بریم که قابلیت استخراج قواعد فازی بصورت خودکار دارد. آموزش پارامترهای مقدمه و نتیجه شبکه برپایه الگوریتم پس انتشار خطا (گرادیان نزولی) می باشد. الگوریتم پیشنهادی با استفاده از داده های 10 شرکت که هر کدام از آنها دارای 7 ویژگی می باشند، ارزیابی شده است. نتایج شبیه سازی نشان می دهد که با توجه به نوع شرکتها، ویژگیهای انتخابی و نوع ساختار شبکه عصبی فازی ترکیبی نتایج متفاوتی بدست می آید. با توجه به معیارهای مورد ارزیابی، نتایج به دست آمده برتری شبکه عصبی فازی ترکیبی را به شبکه عصبی فازی ساده نشان می دهد، اما بطور کلی پیش بینی کننده با ساختار سوگنو با الگوریتم ژنتیک دارای عملکرد بهتری نسبت به ساختار ممدانی دارد، چون تعداد پارامترهای آموزش ساختار سوگنو بیشتر است.
۴.

کاربرد روش انتخاب ویژگی هارک (HARC) در پیش بینی درماندگی مالی شرکت ها در بورس اوراق بهادار تهران

کلیدواژه‌ها: الگوریتم ژنتیک نسبت های مالی پیش بینی درماندگی مالی انتخاب ویژگی

حوزه های تخصصی:
تعداد بازدید : ۸۸۷ تعداد دانلود : ۶۱۳
یکی از مسائل مهم در پیش بینی درماندگی مالی، انتخاب متغیرهای پیش بین می باشد. پژوهش پیش رو به نشان رویکردی جدید برای انتخاب ویژگی با استفاده از دسته بندی نسبت های مالی بر مبنای مفاهیم مالی و ترکیب روش های آماری با الگوریتم های فراابتکاری می پردازد. بدین منظور 34 نسبت مالی برای شرکت های تولیدی درمانده براساس ماده 141 قانون تجارت و به همان تعداد شرکت سالم به صورت تصادفی از شرکت های پذیرفته شده در بورس اوراق بهادار تهران در بازه زمانی 1380 تا1390با استفاده از صورت های مالی حسابرسی شده برای یک و دو سال قبل از درماندگی جمع آوری شده است. سپس با استفاده از آزمون آماری تی و الگوریتم ژنتیک، بهترین نسبت ها انتخاب و با استفاده از ماشین بردار پشتیبان، پیش بینی درماندگی مالی انجام شده است. نتایج بدست آمده از پژوهش حاکی از آن است که روش پیشنهادی هارک در یک و دو سال پیش از وقوع درماندگی به طور معناداری در پیش بینی درماندگی مالی نسبت به رگرسیون لجستیک و مدل آلتمن از عملکرد بهتری برخوردار است.
۵.

روشی نوین به منظور طبقه بندی داده های چند بازگشتی لایدار با استفاده از اطلاعات هندسی مجاورتی و فضای پدیده(مقاله علمی وزارت علوم)

کلیدواژه‌ها: خوشه بندی انتخاب ویژگی فضای پدیده لیزر اسکنر هوایی تحلیل مجاورت فضای ویژگی

حوزه های تخصصی:
تعداد بازدید : ۸۰۳ تعداد دانلود : ۴۸۶
داده های اخذ شده توسط سیستم های لیزر اسکنر هوایی به دلیل برخورداری از مزایایی نظیر دقت هندسی نسبتاً بالا و تراکم مکانی بالای نقاط، اطلاعات هندسی متنوع و منحصر به فردی از سطوح فیزیکی عوارض فراهم می آورند. طبقه بندی و تفکیک داده های ابر نقطه به عوارض سازنده ی محیط، نقش مهمی در روند مدلسازی سه بعدی عوارض ایفا می کند. در مقاله پیش رو، مسأله ی تفکیک ابرنقاط بعنوان یک فرایند طبقه بندی نظارت شده مدنظر قرار گرفته شده است؛ روند اجرایی در روش پیشنهادی مبتنی بر سه گام بوده که در گام نخست، برای هر نقطه از ابرنقاط مجموعه ای از ویژگی ها مبتنی بر تحلیل های مجاورتی تولید می گردد. در گام دوم، ویژگی های بهینه به کمک داد ه های آموزشی و فضای پدیده استخراج شده و در نهایت، طی یک الگوریتم خوشه بندی، با استفاده از ویژگی های استخراج شده، داده های ابر نقطه به کلاس های مد نظر طبقه بندی می گردند. از این روش بمنظور طبقه بندی ابر نقاط چندبازگشتی لایدار مربوط به یک منطقه ی شهری استفاده شد که نتایج طبقه بندی، دقت کلی معادل 15/93درصد و ضریب کاپای 89/0 را نشان دادند.
۶.

پیش بینی روند تغییرات قیمت سهم با استفاده از ماشین بردار پشتیبان وزن دهی شده و انتخاب ویژگی هیبرید به منظور ارائه استراتژی معاملاتی بهینه(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ماشین بردار پشتیبان انتخاب ویژگی پیش بینی روند استراتژی معاملاتی

حوزه های تخصصی:
تعداد بازدید : ۸۹۶ تعداد دانلود : ۶۶۲۲
در این پژوهش، یک مدل پیش بینی براساس روش ماشین بردار پشتیبان تعدیل شده با استفاده از وزن دارکردن تابع جریمه مدل با توجه به حجم معاملات واقعی روزانه به منظور افزایش دقت پیش بینی نوسان های کوتاه مدت در بازار سهام و دست یابی به استراتژی معاملاتی بهینه، ارائه شده است. همراه با طبقه بندی کننده ماشین بردار پشتیبان تعدیل شده، از یک روش انتخاب ویژگی هیبرید، مرکب از یک بخش فیلتر کننده و یک بخش پوشش دهنده به منظور انتخاب زیرمجموعه ای بهینه از ویژگی ها استفاده شده است. همچنین به منظور بررسی توانایی مدل پیشنهادی در پیش بینی روند قیمت، یک استراتژی معاملاتی بر پایه نتایج مدل داده می شود. ورودی مدل چندین شاخص تحلیل تکنیکال و شاخص های آماری متعددی هستند که برای تعداد 10 سهم انتخاب شده از بورس اوراق بهادار تهران محاسبه شده اند. نتایج نشان می دهد که مدل ماشین بردار پشتیبان وزن دهی شده، همراه با روش انتخاب ویژگی هیبرید پیشنهاد شده، میزان دقت پیش بینی را به میزان قابل توجهی افزایش داده و نیز نتایج استراتژی معاملاتی پیشنهادشده را نسبت به استراتژی های رقیب، هم از لحاظ میزان بازده کلی و هم از لحاظ میزان بیشینه ضرر در طول دوره سرمایه گذاری بهبود می بخشد.
۷.

پیش بینی خطر سقوط قیمت سهام با استفاده از الگوریتم ژنتیک و مقایسه با رگرسیون لوجستیک، با تأکید بر نگرش انتخاب ویژگی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: الگوریتم ژنتیک انتخاب ویژگی خطرسقوط قیمت سهام شبکه عصبی مصنوعی

حوزه های تخصصی:
تعداد بازدید : ۹۴۶ تعداد دانلود : ۶۰۰
ریسک سقوط قیمت سهام، شاخصی برای اندازه گیری عدم تقارن در ریسک محسوب می شود و از اهمیت فراوانی در تحلیل پرتفوی و قیمت گذاری دارایی های سرمایه ای برخوردار است. با توجه به اهمیت ریسک سقوط، پژوهش های متعددی به بررسی عوامل موثر بر آن پرداخته اند که در تمام آنها از روش های سنتی به منظور پیش بینی استفاده شده است در حالی که در سال های اخیر روش های نوین فراابتکاری در سایر مباحث مالی به طور گسترده ای مورد استفاده قرار گرفته است و نتایج بهتری داشته اند. هدف این پژوهش، مدل بندی پیش بینی خطر سقوط قیمت سهام شرکت های پذیرفته شده در بورس اوراق بهادار تهران، با استفاده از الگوریتم ژنتیک و مقایسه نتایج با رگرسیون لجستیک می باشد. بدین منظور یک فرضیه برای بررسی این موضوع تدوین و داده های مربوط به 107 شرکت عضو بورس اوراق بهادار تهران برای دوره زمانی بین سال های 1389تا 1395 مورد تجزیه و تحلیل قرار گرفت. ابتدا 14 متغیر مستقل به عنوان ورودی الگوریتم ترکیبی ژنتیک و شبکه عصبی مصنوعی که به عنوان یک روش انتخاب ویژگی در نظر گرفته شده است، وارد مدل گردید و 7 متغیر بهینه انتخاب شد سپس با استفاده از الگوریتم ژنتیک و رگرسیون لجستیک اقدام به پیش بینی خطر سقوط قیمت سهام گردید. برای محاسبه خطر سقوط قیمت سهام از معیار دوره خطر استفاده شده است. .نتایج این پژوهش نشان می دهدکه مدل مبتنی بر الگوریتم ژنتیک نسبت به رگرسیون لجستیک، برای پیش بینی خطر سقوط قیمت سهام توانایی بیشتری دارد. بنابراین فرضیه پژوهش تأیید می شود.
۸.

پیش بینی روند قیمت سهام با استفاده از ماشین بردار پشتیبان تعدیل یافته همراه با انتخاب ویژگی هیبرید(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی روند ماشین بردار پشتیبان انتخاب ویژگی قیمت سهم

حوزه های تخصصی:
تعداد بازدید : ۴۹۹ تعداد دانلود : ۴۷۱
در پژوهش حاضر، مدلی برای پیش بینی روند قیمت سهام برپایه ی ماشین بردار پشتیبان وزن دهی شده توسط حجم های روزانه معاملات، همراه با روش انتخاب ویژگی هیبرید F-SSFS ارائه می شود. به منظور ارزیابی دقت پیش بینی، مدل پیشنهادی با مدل ماشین بردار پشتیبان ساده همراه با انتخاب ویژگی هیبرد و نیز با روش های انتخاب ویژگی مرسوم از جمله بهره اطلاعات [1]، عدم قطعیت متقارن [2]و انتخاب ویژگی بر پایه همبستگی [3]، از طریق انجام آزمون تی زوجی، مقایسه می شود؛ همچنین به عنوان مجموعه ویژگی های اولیه که در واقع ورودی ماشین بردار پشتیبان تعدیل یافته هستند، از شاخص های تحلیل تکنیکال و شاخص های آماری که برای 10 سهم محاسبه شده اند، استفاده می شود. نتیجه این پژوهش نشان می دهد که عملکرد ماشین بردار پشتیبان وزن دهی شده، در مورد مسئله پیش بینی روند قیمت سهام، به میزان قابل توجهی بهتر از ماشین بردار پشتیبان ساده است. علاوه براین، نتایج عملیاتی نشان می دهد که ماشین بردار پشتیبان وزن دهی شده همراه با انتخاب ویژگی هیبرید پیشنهادی، بالاترین میزان دقت پیش بینی را نسبت به سه روش انتخاب ویژگی دیگر دارد. براساس نتایج این پژوهش می توان ادعا کرد مدل VW-SVM همراه با انتخاب ویژگی F-SSFS عملکرد بهتری در پیش بینی قیمت سهم، نسبت به روش های موجود دارد. 2. Information Gain 3. Symmetrical uncertainty 4. Correlation based feature selection
۹.

ادغام خصیصه های اجتماعی- اقتصادی و سنجش ازدوری به منظور مدل سازی رشد فیزیکی شهر کرج(مقاله علمی وزارت علوم)

کلیدواژه‌ها: انتخاب ویژگی مدلسازی رشد فیزیکی شهر رگرسیون لجسیتک پرسپترون چندلایه نقشه خود سازمان دهنده

حوزه های تخصصی:
تعداد بازدید : ۳۸۹ تعداد دانلود : ۳۷۸
در تجزیه و تحلیل و مدل سازی رشد فیزیکی شهر معمولاً عوامل اقتصادی- اجتماعی به دلیل عدم دسترسی به این داده ها نادیده گرفته می شوند. به همین دلیل در مدل سازی رشد فیزیکی شهرها تاکنون بر ایجاد لایه های اطلاعاتی از این نوع داده ها کمتر کار شده است. این مطالعه با هدف معرفی روشی کارا به منظور ایجاد لایه های اطلاعاتی برای داده های اقتصادی- اجتماعی و استفاده از این لایه های اطلاعاتی در کنار لایه های اطلاعاتی مستخرج از تصاویر ماهواره ای لندست و اطلاعات پیمایش زمینی به منظور مدل سازی رشد فیزیکی شهر کرج انجام شد. بدین منظور پس از ایجاد لایه های اطلاعاتی مختلف با اهمیت ترین متغیرهای مؤثر در رشد شهری با روش انتخاب ویژگی جنگل تصادفی تعیین گردید و سپس مدل سازی رشد فیزیکی شهر کرج برای سال های 2000 تا 2010 با استفاده از روش های رگرسیون لجستیک چند متغیره، پرسپترون چندلایه و روش نقشه خود سازمان دهنده انجام شد. نتایج نشان داد که استفاده از با اهمیت ترین متغیرهای مؤثر به عنوان ورودی در روش نقشه خود سازمان دهنده با دقت کلی 84.47، کاپا 68.93، ROC برابر با 90.72، FOM برابر با 43.98 و PCM برابر با 84.47 از عملکرد بهتری برخوردار بود، همچنین استفاده از خصیصه های اجتماعی- اقتصادی پیشنهاد شده در این تحقیق در کنار داده های سنجش ازدور می تواند به ارتقا عملکرد روش پیش بینی کننده کمک نماید. سرانجام با استفاده از سلول های خودکار پیش بینی رشد فیزیکی شهر در سال های 2017 و 2027 انجام گردید.
۱۰.

انتخاب ویژگی های بهینه به منظور تعیین ریسک اعتباری مشتریان بانکی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ریسک اعتباری انتخاب ویژگی طبقه بندی داده کاوی

حوزه های تخصصی:
تعداد بازدید : ۴۰۶ تعداد دانلود : ۳۰۰
    ریسک اعتباری که به معنی احتمال عدم بازپرداخت تعهدات توسط مشتریان در سررسید تعبیر می شود به عنوان یکی از عوامل ورشکستگی مؤسسات مالی قلمداد می شود. بدین منظور از تکنیک های داده کاوی نظیر شبکه عصبی، درخت تصمیم، شبکه بیز، k نزدیک ترین همسایه و ماشین بردار پشتیبان برای دسته بندی مشتریان به مشتریان پر ریسک و کم ریسک استفاده شده است. در این مقاله یک روش ترکیبی از الگوریتم بهینه سازی رقابت استعماری و شبکه عصبی برای افزایش دقت دسته بندی در ارزیابی و سنجش ریسک اعتباری مشتریان بانکی ارائه می دهد. این روش با شناسایی زیر مجموعه ی ویژگی های بهینه و حذف ویژگی های غیرضروری از تمامی ویژگی های موجود در داده ها به کاهش ابعاد مسئله و افزایش دقت طبقه بندی می پردازد. رویکرد پیشنهادشده بر روی مجموعه داده های واقعی پایگاه داده UCI و همچنین داده های واقعی یک بانک خصوصی ایرانی به منظور اعتبارسنجی اعمال شد. نتایج تجربی به دست آمده نشان داد میزان خطای شبکه عصبی برای مجموعه آزمون با انتخاب ویژگی های مؤثر و حذف ویژگی های کم اثر توسط الگوریتم بهینه سازی صفر و یک رقابت استعماری کاهش می یابد. بعلاوه، برای سایر روش ها طبقه بندی استفاده شده، میزان خطای داده آزمون در حد قابل قبولی باقی می ماند. برای اولین بار در این مقاله از الگوریتم رقابت استعماری برای ارزیابی ریسک اعتباری مشتریان بانکی استفاده شده است.    
۱۱.

پیشبینی وفاداری و رویگردانی بیمه شدگان خویش فرمای سازمان تامین اجتماعی

نویسنده:

کلیدواژه‌ها: تامین اجتماعی وفاداری و رویگردانی طبقه بندی انتخاب ویژگی

حوزه های تخصصی:
تعداد بازدید : ۳۴۲ تعداد دانلود : ۳۶۰
وفاداری و رویگردانی مشتریان یکی از چالش های مهم شرکتها و موسساتی است که خدمات و کالا را به مشتریان خود عرضه میکنند. سازمان تامین اجتماعی هم در موضوع وفاداری بیمه شدگان خویش فرما جهت ادامه بیمه پردازی، در سالهای اخیر با چالش فوق مواجه بوده است. در این پژوهش اطلاعات و شاخصهای مهم حدود 21407 نفر در قالب 27 ویژگی از بانکهای اطلاعاتی سازمان مذکور استخراج گردید. سپس با استفاده از الگوریتم NSGA-II، تعداد 7 ویژگی مهم که دارای حداقل خطای طبقه بندی بودند، انتخاب شد. در ابتدا عملیات طبقه بندی داده ها با شبکه عصبی چندلایه برروی داده های موجود و با استفاده از 27 ویژگی انجام شد و دقت طبقه بندی 97.6 درصد بدست آمد. پس از انتخاب بهترین طبقه بند که شبکه عصبی بود، عملیات طبقه بندی با شبکه عصبی برروی همان داده ها و در قالب 7 ویژگی انجام شد و دقت 96.8 درصد بدست آمد. در مرحله انتخاب بهترین طبقه-بند جهت انجام پیش بینی های مورد نیاز، از 3 الگوریتم شبکه عصبی چندلایه، الگوریتم ماشین بردار پشتیبان (SVM) و الگوریتم KNN استفاده شد که نهایتاً شبکه عصبی چندلایه، بهترین دقت طبقه بندی را با مقدار 96.8 درصد بدست آورد. سپس برای شبکه عصبی مذکور با استفاده از 7 ویژگی مربوط به داده های سالهای 1367 تا 1395 آموزش انجام شد. از شبکه عصبی آموزش دیده جهت پیش بینی وفاداری و رویگردانی مشتریان سالهای 1396 و 1397 که به تعداد 8364 رکورد می باشد، استفاده شد. نهایتاً این نتیجه حاصل شد که با در نظر گرفتن همه احتمالات، حدود 27.65 درصد از بیمه شدگان خویش فرمای سالهای 1396و1397 در کلاس رویگردان دسته بندی خواهند شد.
۱۲.

طراحی سیستم پیش بینی بیماری قلبی-عروقی با استفاده از الگوریتم های یادگیری ماشین

تعداد بازدید : ۱۲۳۹ تعداد دانلود : ۵۴۴
بیماری های قلبی یکی از شایع ترین بیماری هاست که در حال حاضر تعداد افراد مبتلا به این نوع بیماری ها در حال افزایش می باشد. این در حالی است در صورتی که مراقبت های لازم برای بیمار در زمان مناسب صورت نگیرد، می تواند باعث مرگ بیمار شود. از این رو تشخیص دقیق در مرحله معاینه اولیه به همراه درمان مناسب می تواند منجر به اجتناب از افزایش میزان مرگ ومیر ناشی از بیماری قلبی گردد. برای رسیدن به این مهم می توان از تکنیک های موجود در زمینه داده کاوی بهره گرفت. داده کاوی داده های مفیدی را از مجموعه داده های موجود استخراج می کند که منجر به پیش بینی یا دسته بندی اطلاعات از طریق خوشه بندی، کلاس بندی و یا کشف الگوهای پنهان می شود. تاکنون تحقیقات زیادی با استفاده از مدل های داده کاوی در تشخیص بیماری های مختلف مانند بیماری های قلبی و عروقی انجام شده است.. در این مقاله قصد داریم با استفاده از رویکردی مبتنی بر انتخاب ویژگی به عنوان یک گام پیش پردازش، مدلی باهدف تشخیص بیماری قلبی ارائه گردد. راهکار پیشنهادی دارای 3 گام اصلی می باشد که گام1) پیش پردازش داده ها با هدف رفع مقادیر Null و پرت در مجموعه داده ها، گام2) انتخاب ویژگی های موثر با بهره وری از 2 روش ضریب همبستگی پیرسون و تجزیه و تحلیل مولفه های اصلی که سعی در حذف ویژگی هایی که با صفت هدف رابطه خاصی ندارند و رفتار این ویژگی مستقل از صفت هدف می باشند، است. و در گام3) با استفاده از 3 الگوریتم J48، شبکه بیزین و SVM مدلی برای پیش بینی بیماری قلبی ساخته می شود. نتایج بدست آمده نشان می دهد الگوریتم J48 با دقت 0.89 دارای بالاترین دقت است.
۱۳.

پیش بینی شاخص کل بورس اوراق بهادار تهران با رویکرد سیستم استنتاج عصبی- فازی انطباق پذیر و الگوریتم رقابت استعماری(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی بازار بورس الگوریتم رقابت استعماری شبکه فازی عصبی انطباق پذیر انتخاب ویژگی سری های زمانی

حوزه های تخصصی:
تعداد بازدید : ۴۰۰ تعداد دانلود : ۲۰۳
  در این پژوهش یک روش نوین ترکیبی برای پیش بینی شاخص کل بورس اوراق بهادار تهران ارائه شده است که هم زمان از الگوریتم رقابت استعماری به عنوان روش انتخاب ویژگی و شبکه فازی عصبی انطباق انطباق پذیر به عنوان تابع پیش بینی کننده استفاده می نماید. برای انجام این امر از 68 ویژگی مؤثر بر بازار بورس اوراق بهادار؛ که شامل شاخص های اقتصادی، شاخص های بورس ایران و سایر کشورها، شاخص های تحلیل فنی و شاخص های شمعدان ژاپنی به صورت روزانه در بازه زمانی 1389-1395 به عنوان ورودی مدل استفاده شده است. همچنین، شاخص کل بورس اوراق بهادار روز آتی به عنوان متغیر هدف مسئله مسأله در نظر گرفته شده است. نتایج به دست آمده نشان می دهد که مدل ترکیبی شبکه عصبی- فازی انطباق انطباق پذیر و الگوریتم رقابت استعماری پیش بینی های بسیار مناسب تری داشته و به نسبت شبکه های عصبی منفرد از سرعت بالاتر و توانایی تقریب قوی تری برای پیش بینی شاخص کل بورس اوراق بهادار برخوردار بوده است.  
۱۴.

ارائه مدل ترکیبی الگوریتم مورچگان باینری و ماشین بردار پشتیبان ( BACO-SVM ) برای انتخاب ویژگی و طبقه بندی مشتریان بانکی به همراه مطالعه موردی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ریسک اعتباری رتبه بندی اعتباری ماشین بردار پشتیبان انتخاب ویژگی الگوریتم بهینه سازی مورچگان باینری

حوزه های تخصصی:
تعداد بازدید : ۳۵۱ تعداد دانلود : ۲۵۶
یکی از مهم ترین مسائلی که همواره بانک ها و موسسات مالی با آن مواجه هستند، مسئله ریسک اعتباری می باشد. رقم قابل توجه مطالبات معوق بانک ها در سراسر جهان نشان دهنده اهمیت این موضوع و لزوم توجه به آن می باشد. از این رو تاکنون تلاش های بسیاری به منظور ارائه مدلی کارا جهت ارزیابی و طبقه بندی هر چه دقیق تر متقاضیان تسهیلات اعتباری صورت گرفته است. در این راستا، پژوهش حاضر سعی در ارائه رویکردی نو برای ارزیابی ریسک اعتباری مشتریان بانکی دارد. روش ماشین بردار پشتیبان ( SVM ) به عنوان طبقه بندی کننده ی اصلی با یک روش انتخاب ویژگی به نام الگوریتم مورچگان باینری ( BACO-SVM ) ترکیب می گردد. به منظور نشان دادن اثر بخشی روش پیشنهادی از داده های مربوط به 85 شرکت از تسهیلات گیرندگان حقوقی یک بانک ایرانی در یک بازه ی 5 ساله (1389-1393) به همراه 16 ویژگی مربوط به هر یک از آن ها استفاده نموده ایم. نتایج روش BACO-SVM با روش PSO-SVM، GA-SVM و روش SVM به تنهایی مقایسه گردیده است. یافته های پژوهش دلالت بر آن داشته که در ارزیابی ریسک اعتباری، مدل BACO-SVM نسبت به روش های دیگر از عملکرد خوبی برخوردار است. در نتیجه با استفاده از روش BACO-SVM به طبقه بندی مشتریان به دو گروه مشتریان خوش حساب و بدحساب می پردازیم. و در نهایت جهت افزایش انعطاف پذیری در تصمیم گیری، مشتریان خوش حساب را با استفاده از روش VIKOR رتبه بندی می کنیم. این رتبه بندی منجر به آن می شود که قضاوت دقیق تری درباره ی وضعیت ریسک اعتباری متقاضیان خوش حساب صورت گیرد.
۱۵.

ترکیب تصاویر چندطیفی و SAR با قدرت تفکیک مکانی بالا به منظور آشکارسازی ساختمان ها در مناطق شهری(مقاله علمی وزارت علوم)

کلیدواژه‌ها: آشکارسازی ساختمان انتخاب ویژگی SVM شبکه عصبی

حوزه های تخصصی:
تعداد بازدید : ۴۰۲ تعداد دانلود : ۱۷۵
در این مقاله، به منظور رفع برخی محدودیت های شناسایی ساختمان در تصاویر چندطیفی، از داده SAR به منزله داده مکمل استفاده می شود. در روش پیشنهادی، برای استفاده هم زمان از اطلاعات مفید در تصاویر رادار و چندطیفی، استراتژی مبتنی بر تلفیق تصاویر، با هدف شناسایی ساختمان، مطرح می شود. همچنین، ازآن جاکه انتخاب ویژگی نقش بسزایی در شناسایی و طبقه بندی عوارض دارد، اغلب روش های مرسوم و رایج در این زمینه، مانند الگوریتم ژنتیک، نیازمند داده های آموزشی اند؛ اما دردسترس نبودن همیشگی این نوع داده های آموزشی یکی از دغدغه های مهم محققان به شمار می آید. پس در این تحقیق، دو روش انتخاب ویژگی فیلترمبنا بررسی می شود تا مشخص شود آیا روش های یادشده می توانند، در مواقع لازم (نبودِ داده آموزشی)، جایگزین الگوریتم ژنتیک شوند؟ بنابراین، در پژوهش حاضر، ابتدا بردار ویژگی بهینه از تصویر چندطیفی و SAR، با سه روش MNF وPCA  و ژنتیک، تعیین و هریک جداگانه وارد هر دو طبقه بندی کننده شبکه عصبی و SVM می شود. سپس به منظور رفع مشکلاتی، همچون تشابه طیفی پشت بام ها با پوشش آسفالت خیابان ها، در تصاویر چندطیفی و بهبود نتایج، دو تصویر چندطیفی و SAR در سطح ویژگی تلفیق می شود. در نهایت و در مرحله بعدی، بهترین تصاویر طبقه بندی شده با شبکه عصبی و SVM، در تمامی بررسی های صورت گرفته تا به این مرحله، وارد تلفیق در سطح تصمیم گیری می شوند. نحوه تلفیق در سطح تصمیم گیری بدین صورت است که اطلاعات همسایگی هر پیکسل در قالب پنجره مکانی متحرک در ابعاد متفاوت، با هدف تصمیم گیری درمورد ماهیت هر پیکسل، استفاده می شود. بنابراین، نتایج حاصل شده در این تحقیق، با صحت کلی و دقت شناسایی ساختمان، به ترتیب 92.82% و 80.14% بیانگر عملکرد مناسب این روش است.
۱۶.

طبقه بندی EEG در دو سطح نرمال و دارای اضطراب با استفاده از ویژگی های غیر خطی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: الکتروآنسفالگرافی اضطراب ویژگیهای غیرخطی انتخاب ویژگی شبکه پرسپترون چندلایه

حوزه های تخصصی:
تعداد بازدید : ۲۴۳ تعداد دانلود : ۱۶۹
اضطراب واکنش طبیعی انسان ها در برابر فشار روانی است که در رویارویی با عوامل مختلف ایجاد می شود. امروزه، حالت های اضطرابی توسط متخصصان با استفاده از نشانه های اضطراب و با ارائه پرسش هایی تشخیص داده می شود. هدف از این مطالعه تحلیلی-مشاهده ای، طبقه بندی خودکار دو سطح اضطراب و نرمال با تحلیل سیگنال الکتروانسفالوگرام است. در این مقاله، از پایگاه داده DASPS استفاده شد که حاوی الکتروانسفالوگرام 14 کاناله از 23 نفر (13 زن و 10 مرد، میانگین سن 30 سال) در حین ایجاد اضطراب است. تحریک اضطراب به صورت غرقه سازی، مواجهه واقعی با یک محرک ترسناک ارائه شده است. دادگان بر اساس نتایج آزمون خودارزیابی آدمک به دو گروه (1) نرمال و اضطراب کم و (2) اضطراب متوسط و زیاد تقسیم بندی شدند. آنتروپی تقریبی، بعد فرکتال و نمای لیاپانوف به عنوان ویژگی های غیر خطی از تمام کانال ها استخراج شدند. از حداقل افزونگی حداکثر ارتباط برای انتخاب بهترین ویژگی جهت اعمال به شبکه پرسپترون چند لایه استفاده شد. برای ارزیابی عملکرد الگوریتم، ساختارهای مختلف شبکه از حیث تعداد ویژگی و نورون و همچنین ابعاد مختلف ویژگی بررسی شد. ماکزیمم صحت، دقت، f1-score و حساسیت در 20 بار تکرار در تمامی حالات برابر با 100 است و با افزایش تعداد نورون، میانگین صحت افزایش می یابد. بهترین نتایج برای تعداد 5 ویژگی و 15 نورون بدست آمد که میانگین صحت، دقت، f1-score و حساسیت برای آن به ترتیب 80 %، 75/92 %، 15/84 % و 58/80 % بود. نتایج این مقاله نشان دهنده ی توانمندی الگوریتم پیشنهادی برای تشخیص افراد مضطرب از افراد نرمال می باشد .
۱۷.

ارائه یک روش ترکیبی به منظور پیش بینی درماندگی مالی شرکت های پذیرفته شده در بورس اوراق بهادار تهران(مقاله علمی وزارت علوم)

کلیدواژه‌ها: انتخاب ویژگی تصمیم گیری چندمعیاره تودیم درماندگی مالی دیمتل

حوزه های تخصصی:
تعداد بازدید : ۳۰۸ تعداد دانلود : ۱۵۰
هدف: هدف این پژوهش ارائه رویکردی جدید برای انتخاب متغیرهای مؤثر در پیش بینی درماندگی مالی با استفاده از نظر خبرگان و الگوریتم های تصمیم گیری است. روش: بدین منظور 29 نسبت مالی برای شرکت های تولیدی درمانده مالی بر اساس ماده 141 قانون تجارت و به همان تعداد شرکت سالم به صورت تصادفی از شرکت های پذیرفته شده در بورس اوراق بهادار تهران در بازه زمانی 1385 تا 1395 با استفاده از صورت های مالی حسابرسی شده برای یک، دو و سه سال قبل از درماندگی جمع آوری شده است. سپس با استفاده از آزمون آماری و الگوریتم های تصمیم گیری دیمتل و تودیم فازی، بهترین نسبت های مالی به همراه ضریب اهمیت هر یک انتخاب و با استفاده از ماشین بردار پشتیبان، پیش بینی درماندگی مالی انجام شد. یافته ها: آزمون مقایسات زوجی نشان داد که اختلاف دقت مدل پیشنهادی در پیش بینی درماندگی مالی برای هر سه سال t-1، t-2 و t-3 نسبت به دقت مدل های آلتمن و رگرسیون لجستیک در سطح خطای 5 درصد معنادار بوده است. نتیجه گیری: با توجه به نتایج آزمون های تحقیق می توان نتیجه گیری کرد که مدل پیشنهادی در یک، دو و سه سال پیش از وقوع درماندگی مالی، به طور معناداری از عملکرد بهتری در پیش بینی درماندگی نسبت به روش رگرسیون لجستیک و مدل آلتمن برخوردار است.
۱۸.

پیش بینی شاخص کل بورس اوراق بهادار تهران با استفاده از رگرسیون بردار پشتیبان بر مبنای تکنیک کاهش ابعاد(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی شاخص بورس رگرسیون بردار پشتیبان تکنیک کاهش ابعاد انتخاب ویژگی تجزیه و تحلیل مولفه های اصلی

حوزه های تخصصی:
تعداد بازدید : ۲۱۷ تعداد دانلود : ۱۳۸
بازارهای سهام نقش مهمی در سازماندهی سیستم های اقتصادی مدرن دارند. پژوهش های گسترده ای در زمینه پیش بینی آن ها با استفاده از تکنیک های هوشمند انجام شده است. با توجه به این که دقت عملکرد این تکنیک ها به میزان قابل توجهی تحت تأثیر ویژگی های ورودی آن است، یکی از پیشرفت های به کار رفته در استفاده از مدل های هوشمند، علاوه بر کاربرد مدل های ترکیبی، استفاده از کاهش ابعاد به عنوان یک پیش مرحله برای مدل پیش بینی می باشد. در این پژوهش برای پیش بینی روزانه شاخص کل بورس اوراق بهادار تهران همزمان از دو روش کاهش ابعاد (انتخاب و استخراج) به منظور انتخاب ویژگی های مناسب به عنوان ورودی های مدل استفاده می شود. به طوری که برای انتخاب ویژگی ها از الگوریتم mRMR-MID و برای استخراج ویژگی ها از الگوریتم PCA استفاده می شود. سپس از رگرسیون بردار پشتیبان به عنوان مدل پیش بینی استفاده می شود. با توجه به نتایج بدست آمده از تحلیل استفاده از تکنیک های کاهش ابعاد در مدل پیش بینی، در نهایت الگوریتمی برای انتخاب ویژگی های مناسب بر شاخص، تحت عنوانISF _MID پیشنهاد می شود. نتایج نشان می دهد که با روش پیشنهادی، می توان با 7 ویژگی انتخابی به دقت بالایی در پیش بینی روزانه شاخص کل بورس اوراق بهادار تهران با درصد خطا 46/3 دست یافت. لازم به ذکر است مدل های مورد بررسی در مرحله پیاده سازی با روش اعتبارسنجی متقابل k-fold مورد ارزیابی قرار گرفتند. همچنین از معیارهای MAE، MSE و RMSE برای ازریابی عملکرد مدل های مذکور استفاده می شود.
۱۹.

مدل سازی آلودگی خاک به فلزات سنگین با استفاده از روشهای یادگیری ماشین و داده های طیف سنجی(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۳۹ تعداد دانلود : ۱۰۹
معادن و صنایع وابسته به آن، در زمان بهره برداری و پس از متروکه شدن، بر محیط زیست اطراف خود تأثیرگذارند. از جمله این تأثیرات می توان به آلودگی آب های زیرزمینی و سطحی، و نیز آلودگی خاک اشاره کرد. مدل سازی غلظت فلزات سنگین با استفاده از روش های مقرون به صرفه لازمه مدیریت و اصلاح آسیب های واردشده به محیط زیست است. هدف این تحقیق ارائه چارچوبی به منظور مدل سازی فلزات سنگین در خاک با استفاده از طیف سنجی و نیز روش های مدل سازی آماری است. بدین منظور با استفاده از طیف سنجی، نمودار طیفی مربوط به 53 نمونه خاک مربوط به منطقه ای در اطراف یک معدن متروکه در ایالت نیوساوث ولز استرالیا در طول موج های مرئی تا مادون قرمز میانی برداشت شد و مشتق دوم این داده ها محاسبه شد. سپس داده های طیفی مناسب برای مدل سازی غلظت فلزات سنگین شامل سرب، نقره، کادمیوم و جیوه با استفاده از روش انتخاب ویژگی جنگل تصادفی تعیین شدند و به عنوان ورودی برای مدل سازی غلظت فلزات سنگین با استفاده از روش های رگرسیون خطی چندمتغیره، جنگل تصادفی رگرسیون و ماشین بردار رگرسیون به کار گرفته شدند. نتایج نشان داد که طول موج های مادون قرمز میانی دارای اهمیت بیشتری به منظور مدل سازی غلظت فلزات سنگین در این تحقیق هستند. همچنین روش های غیرخطی یادگیری ماشین به خصوص جنگل تصادفی رگرسیون با مقادیر مجذور میانگین مربعات خطا ppm 8/0 و ضریب تعیین 51/0 برای سرب و ppm 4/9 و 46/0 برای کادمیوم دارای عملکرد بهتری نسبت به روش رگرسیون خطی چندمتغیره هستند.
۲۰.

بررسی شاخص های اعتبارسنجی مشتریان بانکی با استفاده از روش هوش مصنوعی و دلفی(مقاله علمی وزارت علوم)

تعداد بازدید : ۲۳۸ تعداد دانلود : ۱۵۲
با توجه به اهمیت اعطای اعتبار در نظام بانکی، استفاده از عوامل مؤثر بر اعتبارسنجی جهت تصمیم گیری در اعتباردهی، بسیار مهم است. با توجه به این مهم، تحقیق حاضر به شناسایی و اولویت بندی ویژگی های تأثیرگذار در اعتبارسنجی مشتریان با استفاده از دیدگاه متخصصان و کارشناسان بانکی شهر کرمان و تطابق آن با شاخص های موجود در مدل های استخراج شده از روش هوش مصنوعی پرداخته است. هدف این است که آیا بین نظرات انسانی که ناشی از دانش و تجربه است و نظرات هوش مصنوعی که به مسئله به صورت مدل سازی جعبه سیاه نگاه می کنند، تطابق وجود دارد یا خیر. داده های موردنیاز به روش پرسشنامه و الگوریتم باینری کوانتومی جمعیت ذرات، جمع آوری شده و به ترتیب به روش دلفی و فرا ابتکاری موردبررسی قرارگرفته اند. نتایج حاکی از آن است که شاخص های منتخب دو روش 80 درصد همپوشانی داشته اند. با توجه به نتایج تحقیق و دقت بالای تکنیک های هوش مصنوعی، پیشنهاد می شود جهت اعطای اعتبار به مشتریان در بانک ها و مؤسسات مالی و اعتباری، وزن بالاتری برای شاخص های مذکور لحاظ شود.