مطالب مرتبط با کلیدواژه

ماشین بردار پشتیبان


۲۱.

پیشبینی رویگردانی مشتریان بانک با استفاده از روش داده کاوی(مقاله پژوهشی دانشگاه آزاد)

کلیدواژه‌ها: مشتری رویگردان شبکه عصبی نقشه خود سازمان ده ماشین بردار پشتیبان درخت تصمیم

حوزه‌های تخصصی:
تعداد بازدید : ۸۱۵ تعداد دانلود : ۵۰۱
شدت رقابت درفضای صنعتی ، باعث شده است که تمایل بنگاه های اقتصادی به جذب مشتریان بیشتر کم و، تمایل به فعالیت در زمینه های خدماتی و تولیدی افزایش یافته است. به همین منظور، توسعه روش هایی به منظور شناسایی مشتریان رویگردان و پیش بینی رویگردانی، از مهمترین فعالیت های حوزه فروش به حساب خواهد آمد. در صورتی که بانک فرصت کافی برای پیش بینی رویگردانی مشتریان داشته باشد؛ می تواند به اصلاح ساختارها و خدمات خود به منظور جلوگیری از ریزش تعداد بیشتری از مشتریان بپردازد. تحقیق حاضر، به منظور توسعه چنین مدلی برای بانک شهر صورت گرفته است. به همین منظور، از یک الگوریتم دو مرحله ای خوشه بندی، دسته بندی داده کاوی استفاده شده. به منظور خوشه بندی مشتریان، از نقشه های خودسازمان ده شبکه عصبی که یک روش یادگیری نظارت نشده است؛ استفاده و برای دسته بندی از ماشین بردار پشتیبان و درخت تصمیم استفاده شده است. روش استفاده از این ابزارها به این صورت است که ابتدا از دو مشخصه میانگین موجودی و میانگین تراکنش مشتریان در دوره سه ماهه پایانی استفاده شده و به عنوان ورودی شبکه عصبی در خوشه بندی مورد استفاده قرار گرفته است. پس از آن، در مرحله کلاس بندی، از داده های مربوط به تراکنش های نقدی و اعتباری به منظور کلاس بندی و پیش بینی استفاده شده است. نتایج به دست آمده حاکی از آن است که مدل پیشنهادی بیش از 80% توانایی پیش بینی رویگردانی مشتری را داشته و ماشین بردار پشتیبان عملکرد بهتری از درخت تصمیم نشان داده است.
۲۲.

بررسی سودمندی روش های مختلف انتخاب متغیرهای پیش بین در پیش بینی نوع اظهارنظر حسابرسان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی نوع اظهارنظر حسابرسان روش های انتخاب متغیرهای پیش بین ماشین بردار پشتیبان شبکه های عصبی مصنوعی

حوزه‌های تخصصی:
تعداد بازدید : ۵۵۸ تعداد دانلود : ۵۳۹
پژوهش حاضر به بررسی و مقایسه سودمندی روش های مختلف انتخاب متغیر در پیش بینی نوع اظهارنظر حسابرسان شرکت های پذیرفته شده در بورس اوراق بهادار تهران می پردازد. در این راستا، عملکرد روش های انتخاب متغیر (شامل مبتنی بر همبستگی، آزمون t، تحلیل تشخیصی گام به گام، ریلیف و تحلیل عاملی) بررسی و با یکدیگر مقایسه شده است. طبقه بندی کننده های استفاده شده نیز شامل ماشین بردار پشتیبان و شبکه های عصبی مصنوعی است. ازاین رو، یافته های تجربی مربوط به بررسی 1214 مشاهده (سال- شرکت) پذیرفته شده در بورس اوراق بهادار تهران در بازه زمانی 1386 الی 1393 حاکی از سودمندی و تأثیر مثبت استفاده از روش های انتخاب متغیر بر عملکرد پیش بینی نوع اظهارنظر حسابرسان و هم چنین وجود تفاوت معنادار بین میزان سودمندی این روش ها است. به عبارتی دیگر، در صورت استفاده از متغیرهای منتخب این روش ها نسبت به استفاده از 35 متغیر اولیه ، میانگین دقت افزایش و خطای نوع اول و دوم کاهش می یابد. افزون براین، یافته های پژوهش حاکی از عملکرد بهتر و مناسب ماشین بردار پشتیبان نسبت به شبکه های عصبی است.
۲۳.

پیش بینی روند قیمت سهام با استفاده از ماشین بردار پشتیبان تعدیل یافته همراه با انتخاب ویژگی هیبرید(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی روند ماشین بردار پشتیبان انتخاب ویژگی قیمت سهم

حوزه‌های تخصصی:
تعداد بازدید : ۵۶۳ تعداد دانلود : ۵۵۳
در پژوهش حاضر، مدلی برای پیش بینی روند قیمت سهام برپایه ی ماشین بردار پشتیبان وزن دهی شده توسط حجم های روزانه معاملات، همراه با روش انتخاب ویژگی هیبرید F-SSFS ارائه می شود. به منظور ارزیابی دقت پیش بینی، مدل پیشنهادی با مدل ماشین بردار پشتیبان ساده همراه با انتخاب ویژگی هیبرد و نیز با روش های انتخاب ویژگی مرسوم از جمله بهره اطلاعات [1]، عدم قطعیت متقارن [2]و انتخاب ویژگی بر پایه همبستگی [3]، از طریق انجام آزمون تی زوجی، مقایسه می شود؛ همچنین به عنوان مجموعه ویژگی های اولیه که در واقع ورودی ماشین بردار پشتیبان تعدیل یافته هستند، از شاخص های تحلیل تکنیکال و شاخص های آماری که برای 10 سهم محاسبه شده اند، استفاده می شود. نتیجه این پژوهش نشان می دهد که عملکرد ماشین بردار پشتیبان وزن دهی شده، در مورد مسئله پیش بینی روند قیمت سهام، به میزان قابل توجهی بهتر از ماشین بردار پشتیبان ساده است. علاوه براین، نتایج عملیاتی نشان می دهد که ماشین بردار پشتیبان وزن دهی شده همراه با انتخاب ویژگی هیبرید پیشنهادی، بالاترین میزان دقت پیش بینی را نسبت به سه روش انتخاب ویژگی دیگر دارد. براساس نتایج این پژوهش می توان ادعا کرد مدل VW-SVM همراه با انتخاب ویژگی F-SSFS عملکرد بهتری در پیش بینی قیمت سهم، نسبت به روش های موجود دارد. 2. Information Gain 3. Symmetrical uncertainty 4. Correlation based feature selection
۲۴.

استفاده از آنالیزهای مورفولوژی به منظور بهبود دقت طبقه بندی تصاویر ابر طیفی با حد تفکیک بالا(مقاله علمی وزارت علوم)

کلیدواژه‌ها: آنالیز مورفولوژی ماشین بردار پشتیبان استخراج ویژگی طبقه بندی رأی گیری اکثریت

حوزه‌های تخصصی:
تعداد بازدید : ۶۴۵ تعداد دانلود : ۳۹۵
آنالیز موفولوژی، با تمرکز بر آنالیز روابط مکانی بین پیکسل های همسایه، پردازش تصویر کامل تری را در مقایسه با آنالیزهایی که بر پایة اثر طیفی یک پیکسل تنها هستند، به دست می دهد. روش پیشنهادی در این مقاله با استفادة هم زمان از اطلاعات طیفی و اطلاعات مکانی حاصل از آنالیز مورفولوژی نتایج نهایی طبقه بندی را در تصاویر ابر طیفی بهبود می بخشد. در این پژوهش ابتدا با استفاده از نمونه های آموزشی محدود، ویژگی های منتخب اولیه استخراج شدند و پس از اعمال آنالیزهای مورفولوژی روی هر یک از آنها، پروفایل های مورفولوژی تشکیل شدند و از ترکیب این پروفایل ها، پروفایل مورفولوژی گسترده تولید شد. سپس پروفایل مورفولوژی گسترده شده با ویژگی های منتخب اولیه ترکیب شد و مجدداً استخراج ویژگی نهایی صورت گرفت. ویژگی های منتخب نهایی با استفاده از طبقه بندی کنندة ماشین بردار پشتیبان طبقه بندی شدند. سپس پس پردازش تصویر نهایی با استفاده از فیلتر رأی گیری اکثریت انجام شد. این روش، روی دادة شهری و نیمه شهری از سنجندة ROSIS تست شد. دقت طبقه بندی نهایی از 86/98 و 70/82 درصد در روش های معمولی به 36/99 و 75/95 درصد در روش پیشنهادی به ترتیب در تصویر منطقة شهری و نیمه شهری افزایش یافته است. کلید واژه ها : آنالیز مورفولوژی، ماشین بردار پشتیبان، استخراج ویژگی، طبقه بندی، رأی گیری اکثریت.
۲۵.

ارائه روش رده بندی تک رده ای برای شناسایی متون پژوهشی حوزه محیط زیست ایران با استفاده از ماشین بردار پشتیبان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: محیط زیست رده بندی تک رده ای ماشین بردار پشتیبان متن کاوی وزن دهی NG-TF

حوزه‌های تخصصی:
تعداد بازدید : ۴۷۰ تعداد دانلود : ۴۷۱
رده بندی متون پژوهشی به منظور شناسایی و تحلیل عرضه و تقاضای پژوهشی در حوزه های مختلف علوم اهمیت ویژه ای دارد. در این میان رده بندی پژوهش های حوزه محیط زیست به دلیل اهمیت فراوان آن در کشور و نیز میان رشته ای بودن آن ضروری است. این پژوهش روش رده بندی تک رده ای متون پژوهشی این حوزه را با استفاده از ماشین بردار پشتیبان ارائه می دهد و به ارزیابی پارامترهای مهم تأثیرگذار در کیفیت این رده بندی می پردازد. نتایج نشان می دهد که استفاده از مجموعه داده هسته توصیفی در یادگیری مدل، کارایی بهتری نسبت به هسته محتوایی دارد. همچنین، استفاده از هسته چندجمله ای و وزن دهی دودویی واژه ها در ماتریس بردار ویژگی ها نتایج بهتری نسبت به حالت های معمول دیگر ارائه می کند. در این مطالعه، روش جدید وزن دهی با نام NG-TF معرفی و ارائه شده است که نتایج ارزیابی آن نسبت به روش های دیگر، به ویژه در معیار دقت، برتری قابل توجهی دارد. از این رو، می توان از این روش وزن دهی برای تعیین واژگان نماینده یک حوزه پژوهشی استفاده کرد.
۲۶.

بهبود طبقه بندی منطقه شهری با استفاده از تلفیق تصاویر اپتیک چندباندی و لایدار با قدرت تفکیک مکانی بالا(مقاله علمی وزارت علوم)

کلیدواژه‌ها: مناطق شهری تصاویر اپتیک و لایدار تلفیق در سطح ویژگی الگوریتم ژنتیک ماشین بردار پشتیبان

حوزه‌های تخصصی:
تعداد بازدید : ۴۸۲ تعداد دانلود : ۳۵۳
امروزه با گسترش مناطق شهری تولید اطلاعات دقیق و به روز از جمله اطلاعات اساسی، به منظور مدیریت و برنامه ریزی شهرها است. گسترش روز افزون تکنولوژی سنجش از دور امکان استخراج اطلاعات متنوع از پوشش های شهری را فراهم آورده که موجب جلب توجه محقق های فراوانی به این موضوع شده است. وجود عوارض متنوع و نیز کاربری های مختلف اطلاعات مکانی مناطق شهری، تلفیق منابع داده مختلف به منظور شناسایی عوارض را به امری کاربردی مبدل کرده است. هدف این تحقیق تلفیق ویژگی های بهینه استخراج شده از داده های اپتیک و لایدار به منظور شناسایی عوارض شهری در منطقه مورد مطالعه می باشد. در این راستا ویژگی های مختلفی از هر یک از این داده ها استخراج شده است. از جمله این ویژگی ها می توان به ویژگی های رنگی، شاخص گیاهی و بافت از تصویر اپتیک و ویژگی های نرمی، مدل ارتفاعی رقومی نرمال و زبری از تصویر لیدار اشاره نمود. سپس به منظور انتخاب ویژگی های بهینه از الگوریتم ژنتیک استفاده شده است. در انتها با استفاده از روش طبقه بندی کننده ماشین بردار پشتیبان به شناسایی عوارض مورد نظر پرداخته شده است. دقت طبقه بندی کننده الگوریتم ماشین بردار پشتیبان در منطقه مورد مطالعه با استفاده از ویژگی های بهینه و داده های اولیه 734/88 محاسبه شده که نسبت به طبقه بندی داده اولیه اپتیک چندباندی دارای بهبود 438/25 درصدی و نسبت به طبقه بندی داده اولیه لایدار دارای بهبود 236/18 درصدی است. نتایج بررسی نشان دهنده افزایش دقت طبقه بندی با استفاده از ویژگی های بهینه در کنار باندهای اولیه است.
۲۷.

مدل سازی زوال درختان بلوط با استفاده از شبکه های عصبی مصنوعی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: آنالیز مؤلفه های اصلی بلوط جنگل های زاگرس زوال شبکه عصبی مصنوعی ماشین بردار پشتیبان

حوزه‌های تخصصی:
تعداد بازدید : ۴۸۶ تعداد دانلود : ۵۳۹
جنگل های زاگرس بیشترین تأثیر را در تأمین آب، حفظ خاک و تعدیل آب  و هوای کشور دارد. با این وجود بخش قابل توجهی از این جنگل ها دچار پدیده ی زوال درختان بلوط شده است. مشخص نبودن پارامترهای مؤثر در زوال و نحوه ی ارتباط پارامترها، از جمله عواملی هستند که باعث سخت تر شدن شناخت و مدل سازی این پدیده می شود. هدف این پژوهش تعیین پارامترهای تاثیرگذار برای مدل سازی زوال درختان بلوط و مدل سازی این پدیده با استفاده از شبکه های عصبی مصنوعی در استان لرستان است. در ا ین پژوهش، پارامترهای دما، بارش، ارتفاع، شیب، جهت، نوع خاک و میزان ریزگردها به عنوان پارامترهای اولیه انتخاب شدند. همچنین از عملگرهای ضرب، لگاریتم، تبدیلات هذلولی و آنالیز مؤلفه های اصلی برای ترکیب پارامترها استفاده شد. به دلیل معلوم نبودن نحوه ی ارتباط و میزان اثر هر پارامتر، از شبکه های عصبی مصنوعی برای مدل سازی پدیده زوال استفاده شد. در مجموع 385 ترکیب مختلف از پارامترهای اولیه، با استفاده از عملگرهای فوق تولید و در سه معماری پیش خور با سه لایه پنهان، احتمالاتی و معماری ماشین بردار پشتیبان در شبکه های عصبی، (در مجموع تعداد 1155 شبکه ی عصبی) ارزیابی شد. نتایج ارزیابی نشان داد معماری احتمالاتی ( 87 /0= R ) با ورودی های ارتفاع، جهت، شیب، ریز گرد، نوع خاک و مؤلفه ی اصلی (بارش و دما) بهترین عملکرد را در مدل سازی زوال درختان بلوط دارد. با توجه به نتایج، استفاده از شبکه های عصبی مصنوعی احتمالاتی در شرایط عدم قطعیت و وجود دانش جزئی از پدیده، توصیه می شود. همچنین نتایج نشان دادند که استفاده از مؤلفه ی اصلی پارامترهای دما و بارش، استرس ناشی از خشکی را بهتر مدل می کند. استفاده از ترکیب بهینه ی پارامترها، در مدل احتمالاتی نسبت به ترکیب عادی، باعث افزایش 05/0 ضریب همبستگی شد .
۲۸.

پیش بینی رویگردانی جزئی مشتریان بانک ها با استفاده از مدل زنجیره وضعیت(مقاله علمی وزارت علوم)

کلیدواژه‌ها: رویگردانی جزئی مدل زنجیره وضعیت مشتریان بانک خوشه بندی سلسله مراتبی ماشین بردار پشتیبان

حوزه‌های تخصصی:
تعداد بازدید : ۵۵۵ تعداد دانلود : ۴۵۷
 بانک ها در فضای رقابتی شدید تلاش می کنند تا به منابع مالی بیشتری دست پیدا کنند. با توجه به بالاتر بودن هزینه های جذب مشتری جدید نسبت به نگهداری مشتریان موجود، عمده تلاش بانک ها روی حفظ سپرده های موجود مشتریان در بانک متمرکز است. لذا پیش بینی رویگردانی مشتریان پیش از وقوع برای بانک ها از اهمیت ویژه ای برخوردار است. تقریباً در تمامی تحقیقات مرتبط در بانک ها مشتریان به دو دسته رویگردان و غیر رویگردان با یک تعریف ثابت از رویگردانی تقسیم شده اند؛ اما در شرایط بانکداری ایران نمی توان از یک تعریف ثابت برای رویگردانی استفاده نمود؛ بنابراین لازم است که رویگردانی را به صورت دینامیک و در قالب وضعیت های مختلف تعریف کنیم. برای این منظور در این تحقیق مفهوم زنجیره وضعیت معرفی می شود که تغییرات وضعیت رویگردانی جزئی مشتریان طی زمان را مشخص می کند. با به کارگیری این زنجیره ها و استفاده ترکیبی از تکنیک های خوشه بندی سلسله مراتبی و همچنین ماشین های بردار پشتیبان، مدلی برای پیش بینی رویگردانی جزئی مشتریان بانک ها ساخته شد. برای ساختن نمونه عملی و ارزیابی دقت پیش بینی، پنج سال داده های واقعی مشتریان یک بانک اروپایی و همچنین سه سال داده های مشتریان سه بانک ایرانی مورد استفاده قرار گرفتند. نتایج حاکی از دقت بالای پیش بینی در مدل های ساخته شده روی هر چهار بانک به خصوص با افزایش طول زنجیره های وضعیت در داده های آزمون است.
۲۹.

مقایسه روش های بیشترین شباهت، ماشین بردار پشتیبان و شبکه عصبی مصنوعی در آشکارسازی سطوح نفوذناپذیر شهری با استفاده از تصویر با قدرت تفکیک مکانی بالا(مقاله علمی وزارت علوم)

کلیدواژه‌ها: سطوح نفوذناپذیر شبکه عصبی مصنوعی ماشین بردار پشتیبان بیشترین شباهت بندرعباس GeoEye

حوزه‌های تخصصی:
تعداد بازدید : ۴۷۹ تعداد دانلود : ۳۰۷
سطوح نفوذناپذیر عامل مهمی در نظارت بر توسعه شهری و کیفیت محیط زیست است. به همین دلیل، شناخت این سطوح پیش شرطی برای رسیدن به توسعه پایدار شهری خواهد بود. هر چند روش های گوناگونی برای تشخیص و مطالعه این سطوح وجود دارد ولی تعیین دقیق و مقرون به صرفه این سطوح، هنوز یک چالش مهم برای پژوهشگران شهری است. با توجه به افزایش دسترسی به داده های سنجش از دور، در این پژوهش با استفاده از تصویر سنجنده GeoEye سال 2009، دقت روش های سه گانه طبقه بندی بیشترین شباهت، شبکه عصبی مصنوعی و ماشین بردار پشتیبان را در تعیین سطوح نفوذناپذیر در بخشی از شهر بندرعباس بررسی و مقایسه شده است. به این منظور، بعد از انجام عملیات پیش پردازش های لازم بر روی تصویر، با استفاده از آلگوریتم های مورد اشاره، پنج کلاس خیابان و ساختمان (به عنوان سطوح نفوذناپذیر)، بدنه آبی، پوشش گیاهی و زمین بایر (به عنوان سطوح نفوذپذیر شهری) برای هر سه روش، استخراج شدند. برای ارزیابی نتایج، روش های دقت کلی، ضریب کاپا، دقت کاربر و تولیدکننده  مورد استفاده قرار گرفت. نتایج نشان داد که روش ماشین بردار پشتیبان با دقت کلی7/94 درصد و ضریب کاپا 93/0، نسبت به روش شبکه عصبی مصنوعی (با دقت صحت کلی 1/93 درصد و ضریب کاپا 90/0) و روش بیشترین شباهت (با دقت صحت کلی 2/92 درصد و ضریب کاپا 89/0)، دارای دقت بهتری است. مطالعه حاضر هرچند نشان داد که روش ماشین بردار پشتیبان دارای صحت بالاتری بود اما با این وجود، دقت روش های بیشترین شباهت و شبکه عصبی مصنوعی نیز در تعیین سطوح نفوذناپذیر، مناسب و قابل قبول بوده و پردازش تصاویر با قدرت تفکیک مکانی بالا با این روش ها،  می تواند سطوح نفوذناپذیر را تشخیص دهد.
۳۰.

ارائه مدل دسته بندی موضوعی تولیدات علمی حوزه سلامت با استفاده از روش های متن کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: تولیدات علمی دسته بندی متون سلامت متن کاوی مدل تخصیص پنهان دیریکله مدل موضوعی ماشین بردار پشتیبان یادگیری ماشینی

حوزه‌های تخصصی:
تعداد بازدید : ۸۱۳ تعداد دانلود : ۶۰۳
با گسترش اینترنت و رشد سریع و روزافزون مقالات الکترونیکی، دسته بندی متون به یکی از ابزارهای کلیدی و مهم برای سازماندهی و مدیریت داده تبدیل شده است. در دسته بندی متون، یک مجموعه دانش اولیه در اختیار سامانه قرار می گیرد تا با یادگیری از این مجموعه، اسناد جدید ورودی به یکی از گروه های موضوعی، ملحق گردد. در متون سلامت به علت تنوع زیاد موضوعات، آماده کردن چنین مجموعه آموزش اولیه عملی بسیار زمان بر و هزینه بر است. هدف از مقاله ارائه مدلی ترکیبی از یادگیری (با نظارت و بدون نظارت) برای دسته بندی موضوعی تولیدات علمی حوزه سلامت است که بدون نیاز به مجموعه برچسب خورده اولیه عمل دسته بندی را انجام دهد. برای استخراج مدل موضوعی متون تولیدات علمی سلامت طی سال های 2009 تا 2019 در پایگاه پابمد، با استفاده از روش آمیخته داده کاوی، شامل متن کاوی و یادگیری ماشینی انجام گرفت. بر اساس مدل موضوعی تخصیص پنهان دیریکله، دادها تحلیل و سپس برای دسته بندی متون، از مدل ماشین بردار پشتیبان استفاده شد. در یافته های این پژوهش، مدل دسته بندی متون سلامت در سه گام اصلی معرفی شد. در گام اول پیش پردازش های لازم بر روی مجموعه داده به دلیل حذف کلمات کم تکرار و غیرضروری از مجموعه داده و افزایش دقت مدل پیشنهادی انجام گرفت. در گام دوم موضوعات موجود در متون به کمک روش احتمالاتی تخصیص پنهان دیریکله استخراج و به عنوان یک مجموعه آموزش اولیه در گام سوم به الگوریتم دسته بندی ماشین بردار پشتیبان داده و عمل یادگیری دسته بند به کمک این موضوعات انجام گرفت. درنهایت به کمک دسته بند، موضوع هر سند مشخص گردید. نتایج نشان داد که مدل پیشنهادی می تواند، یک دسته بندی بهتر با استفاده از ترکیب کردن خواص بدون نظارت خوشه بندی و دانش پیشین نمونه ها بسازد. انجام دادن خوشه بندی روی نمونه های برچسب دار با یک معیار شباهت مشخص، متن های مرتبط را باهم ادغام و یک دانش پیشین ایجاد کرده، سپس الگوریتم یادگیری، دسته بندی را با روشی نظارتی آموزش می دهد. ترکیب دسته بندی و خوشه بندی می تواند دقت دسته بندی متون سلامت را افزایش دهد.
۳۱.

ارائه مدل ترکیبی الگوریتم مورچگان باینری و ماشین بردار پشتیبان ( BACO-SVM ) برای انتخاب ویژگی و طبقه بندی مشتریان بانکی به همراه مطالعه موردی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ریسک اعتباری رتبه بندی اعتباری ماشین بردار پشتیبان انتخاب ویژگی الگوریتم بهینه سازی مورچگان باینری

حوزه‌های تخصصی:
تعداد بازدید : ۴۱۵ تعداد دانلود : ۳۴۲
یکی از مهم ترین مسائلی که همواره بانک ها و موسسات مالی با آن مواجه هستند، مسئله ریسک اعتباری می باشد. رقم قابل توجه مطالبات معوق بانک ها در سراسر جهان نشان دهنده اهمیت این موضوع و لزوم توجه به آن می باشد. از این رو تاکنون تلاش های بسیاری به منظور ارائه مدلی کارا جهت ارزیابی و طبقه بندی هر چه دقیق تر متقاضیان تسهیلات اعتباری صورت گرفته است. در این راستا، پژوهش حاضر سعی در ارائه رویکردی نو برای ارزیابی ریسک اعتباری مشتریان بانکی دارد. روش ماشین بردار پشتیبان ( SVM ) به عنوان طبقه بندی کننده ی اصلی با یک روش انتخاب ویژگی به نام الگوریتم مورچگان باینری ( BACO-SVM ) ترکیب می گردد. به منظور نشان دادن اثر بخشی روش پیشنهادی از داده های مربوط به 85 شرکت از تسهیلات گیرندگان حقوقی یک بانک ایرانی در یک بازه ی 5 ساله (1389-1393) به همراه 16 ویژگی مربوط به هر یک از آن ها استفاده نموده ایم. نتایج روش BACO-SVM با روش PSO-SVM، GA-SVM و روش SVM به تنهایی مقایسه گردیده است. یافته های پژوهش دلالت بر آن داشته که در ارزیابی ریسک اعتباری، مدل BACO-SVM نسبت به روش های دیگر از عملکرد خوبی برخوردار است. در نتیجه با استفاده از روش BACO-SVM به طبقه بندی مشتریان به دو گروه مشتریان خوش حساب و بدحساب می پردازیم. و در نهایت جهت افزایش انعطاف پذیری در تصمیم گیری، مشتریان خوش حساب را با استفاده از روش VIKOR رتبه بندی می کنیم. این رتبه بندی منجر به آن می شود که قضاوت دقیق تری درباره ی وضعیت ریسک اعتباری متقاضیان خوش حساب صورت گیرد.
۳۲.

ارزیابی مقایسه ای تصاویر سنجنده OLI ماهواره لندست 8 و سنجنده MSI ماهواره سنتینل 2(مقاله علمی وزارت علوم)

کلیدواژه‌ها: لندست 8 سنتینل 2 همبستگی ماشین بردار پشتیبان ماتریس خطا

حوزه‌های تخصصی:
تعداد بازدید : ۷۳۱ تعداد دانلود : ۳۳۹
مطالعه تطابق محتوای اطلاعاتی سنجندهها به منظور جایگزینی سنجنده ها در مناطقی که امکان دسترسی آسان به دادههای آنها وجود ندارد، در مطالعات سنجش از دور ضروری است. هدف از این پژوهش مقایسهی دو سنجندهی MSI ماهوارهی سنتینل ۲ و OLI ماهوارهی لندست ۸ میباشد تا امکان استفاده از آرشیو تصاویر لندست و همچنین جایگزینی تصاویر این دو ماهواره به جای یکدیگر مورد ارزیابی قرار بگیرد. برای رسیدن به این هدف، شهرستان مینودشت به عنوان منطقهی مورد مطالعه انتخاب گردید. این منطقه از نظر کلاس های پوشش اراضی متنوع بوده و انواع مختلف طبقات پوشش زمین در آن دیده می شود. به منظور بررسی محتوای اطلاعاتی دو سنجنده، سه جفت تصویر نسبتا همزمان از دو سنجنده انتخاب شد. ابتدا باندهای متناظر دو سنجنده که در محدوده طول موج یکسان فعالیت می کنند، تعیین شد. سپس هر زوج تصویر نسبت به هم ثبت هندسی شدند. جهت یکسان کردن اندازهی پیکسلها، قدرت تفکیک مکانی سنجندهی MSI به ۳۰ متر تبدیل شد تا همبستگی باندهای متناظر محاسبه شود. در گام بعدی، طبقه بندی ماشین بردار پشتیبان بر روی تصاویر انجام شد. نمونه های تعلیمی از نقشهی کاربری اراضی شهرستان مینودشت و تصاویر ماهوارهای با قدرت تفکیک مکانی بالا انتخاب شد. برای ارزیابی طبقه بندی با استفاده از نمونه های مستقل، ماتریس خطا تشکیل شد. نتایج نشان داد که تمامی باندهای متناظر همبستگی بالاتر از مقدار ۰.8 دارند و میزان صحت کلی و ضریب کاپای حاصل از طبقه بندی برای هر دو سنجنده تفاوت معنی داری با یکدیگر ندارند. میانگین صحت کلی به دست آمده برای سنجندههای OLI و MSI به ترتیب 91/35٪ و 94/79٪ میباشد. نتایج بدست آمده، نشانگر تطابق بالای دو سنجنده چند طیفی می باشد.
۳۳.

تهیه نقشه حساسیت سیلاب با استفاده از مدل ماشین بردار پشتیبان (SVM) و سیستم اطلاعات جغرافیایی (GIS)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: نقشه حساسیت سیل ماشین بردار پشتیبان داده کاوی ROC حوضه نکارود

حوزه‌های تخصصی:
تعداد بازدید : ۵۶۷ تعداد دانلود : ۳۵۳
تهیه ی نقشه حساسیت سیلاب ضروری و اولین قدم در کاهش خسارات ناشی از سیل می باشد. به علت کمبود اطلاعات در اکثر حوضه ها، بسیاری از تحقیقات از تکنیک های داده کاوی برای مطالعات هیدرولوژی به ویژه سیلاب استفاده می کنند. هدف این پژوهش، شناسایی مناطق حساس به سیل گیری با استفاده از مدل ماشین بردار پشتیبان (SVM) در حوضه نکارورد می باشد. بدین منظور از 12 پارامتر ژئومورفولوژیکی، هیدرولوژیکی و فیزیوگرافیکی شامل مقدار شیب، جهت شیب، طبقات ارتفاعی، دما، کاربری اراضی، بارندگی، تراکم و فاصله از گسل، تراکم و فاصله از آبراهه، تراکم و فاصله از جاده می باشند که در محیط نرم افزارهای ArcGIS، SAGA GIS و ENVI تهیه شدند. به منظور برداشت نقاط سیل گیر نیز از دستگاه GPS استفاده گردید. در نهایت همه متغیرها و نقاط برداشت شده با اندازه پیکسل یکسان (5/12 متر) با فرمت ASCII وارد نرم افزار R شدند. به منظور ارزیابی صحت مدل مذکور از محاسبه ویژگی های عامل نسبی (ROC) در محیط نرم افزار R استفاده شد. نتایج ارزیابی نشان داد که مدل SVM دقت مناسبی در شناسایی پهنه های حساس سیلاب در منطقه مورد مطالعه دارد. همچنین نتایج پژوهش حاضر نشان داد که مناطق حساس به سیل گیری بیشتر در بخش های شمالی و شمال غرب حوزه و در مناطقی قرار گرفته اند که تمرکز سکونتگاه های انسانی بیشتر است، در حالی که مناطق مرکزی حوضه که دارای پوشش گیاهی متراکم است، حساسیت کمی نسبت به سیل گیری دارند. نتایج این پژوهش می تواند به برنامه ریزان و محققان برای انجام اقدامات مناسب به منظور جلوگیری و کاهش خطر سیلاب در آینده کمک کند. همچنین می توان از آن به منظور شناسایی مناطق مناسب و امن برای توسعه های عمرانی استفاده کرد.
۳۴.

تبیین دسته بندهای ماشین بردار پشتیبان و شبکه عصبی جهت درجه بندی شعب بانک(مقاله علمی وزارت علوم)

کلیدواژه‌ها: داده کاوی بانکداری ماشین بردار پشتیبان شبکه عصبی

حوزه‌های تخصصی:
تعداد بازدید : ۴۹۸ تعداد دانلود : ۳۵۹
در صنعت بانکداری اطلاعات زیادی وجود دارد که شناسایی آن از اهمیت ویژه ای برخوردار است. استفاده از تکنیک های داده کاوی نه تنها کیفیت را بهبود می بخشد بلکه منجر به مزایای رقابتی و ارتقای جایگاه بازار نیز می گردد. با استفاده از داده کاوی و به منظور تجزیه و تحلیل الگوها و روندها، بانکها می توانند صحت این را پیش بینی کنند درجه بندی شعب بانک چگونه است. در این مقاله درجه بندی شعب یکی از بانکهای بزرگ تجاری (تعداد شعب انتخاب شده 1825 شعبه و تعداد ویژگی های مورد استفاده 57 ویژگی) با استفاده از دسته بندهای ماشین بردار پشتیبان و شبکه عصبی چند لایه پرسپترون برروی داده های واقعی انجام گرفت. نتایج ارزیابی مربوط به ماشین بردار پشتیبان نشان داد که این دسته بند دارای کارایی پایین تری برای روش پیشنهادی است. اما استفاده از شبکه های عصبی و ترکیب آن با PCA نشان داد که دارای معیارهای کارایی بالایی است. مقادیر مربوط به کارایی و صحت با استفاده از شبکه عصبی با دقت بسیار بالایی بدست آمد.
۳۵.

کاربرد داده کاوی با استفاده از الگوریتم های یادگیری ماشین برای بررسی تاثیر ویژگی های خودرو در پیش بینی ریسک خسارت مالی در رشته بیمه شخص ثالث(مقاله علمی وزارت علوم)

کلیدواژه‌ها: دسته بندی مشتریان درخت تصمیم ماشین بردار پشتیبان نایو بیز و شبکه های عصبی

حوزه‌های تخصصی:
تعداد بازدید : ۶۷۶ تعداد دانلود : ۴۷۳
هدف: طبقه بندی ریسک بیمه گذاران بر مبنای ویژگی های قابل مشاهده می تواند به شرکت های بیمه جهت کاهش زیان، شناخت دقیق تر مشتریان و جلوگیری از وقوع انتخاب نامساعد در بازار بیمه کمک شایانی کند. هدف این مقاله، بررسی خسارت های مالی ایجاد شده در بیمه شخص ثالث و پیش بینی ریسک بیمه گذاران در احتمال وقوع حادثه می باشد. روش شناسی: با استفاده از الگوریتم های درخت تصمیم، ماشین بردار پشتیبان، نایو بیز و شبکه عصبی؛ به کشف الگوهای پنهان داده ها، در راستای طبقه بندی بیمه گذاران بیمه شخص ثالث پرداخته شده است. همچنین توزیع نامتعادل داده ها در دو گروه خسارت دیده و خسارت ندیده سبب یک چالش مهم در کاربرد روش های یادگیری ماشین و داده کاوی است که در این مقاله مورد توجه قرار گرفته است. یافته ها: مجموعه داده متعلق به یکی از شرکت های بیمه و حاوی بیش از چهارصد هزار نمونه ثبت شده در پنج سال و شامل چهار متغیر مستقل نوع خودرو، گروه خودرو، نوع پلاک و سن خودرو و یک متغیر وابسته و دو ارزشی خسارت مالی است. با توجه به نتایج بدست آمده بهترین کارکرد و دقت پیش بینی (با دقت F1=) مربوط به مدل درخت تصمیم می باشد. نتیجه گیری: میزان تاثیرگذاری متغیرها در وقوع خسارت به ترتیب اولویت عبارتنداز: نوع خودرو، نوع پلاک، سن خودرو و گروه خودرو. نتایج ارزیابی نشان می دهد برای پیش بینی دقیق تر خسارت و مشتریان پر ریسک به داده های بیشتری مرتبط با ویژگی های راننده نیاز می باشد.   طبقه بندی موضوعی:G22, G17, F47
۳۶.

پیش بینی درماندگی مالی شرکت های پذیرفته شده در فرابورس و بورس اوراق بهادار تهران با استفاده از ماشین بردار پشتیبان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی درماندگی مالی ماشین بردار پشتیبان یادگیری ماشین داده کاوی بورس اوراق بهادار تهران

حوزه‌های تخصصی:
تعداد بازدید : ۵۲۶ تعداد دانلود : ۴۱۲
هدف این مقاله، پیش بینی درماندگی مالی قریب الوقوع شرکت های پذیرفته شده در فرابورس و بورس اوراق بهادار با استفاده از دامنه گسترده ای از ویژگی ها از جمله متغیرهای حسابداری تعهدی، حسابداری نقدی، بازار سهام، مکانیسم های حاکمیت شرکتی و شاخص های اقتصاد کلان است. نمونه نهایی شامل 421 شرکت و در نتیجه، 3670 شرکت-سال مشاهده است. سپس، داده آماده شده با استفاده از نسبت 70 به 30 به مجموعه داده آموزشی و آزمایشی تفکیک شد. در این پژوهش، تکینک های پیش پردازش داده یادگیری ماشین نظیر استانداردسازی نمره Z، وان-هات انکدینگ، اعتبارسنجی متقابل K لایه طبقه ای، همراه با مهندسی ویژگی برای بهبود عملکرد طبقه بندی کننده بکار گرفته شدند. روش اعتبارسنجی متقابل 5 لایه طبقه ای با برای برآورد عملکرد پیش بینی مدل طی مرحله آموزش استفاده شد. طی مرحله آموزش، میزان سازی اَبرپارامتر مدل با استفاده از جستجوی شبکه ای انجام شد. افزون بر این، رویکرد فرایادگیری حساس به هزینه همراه با معیار مختص مسائل نامتوازن یعنی نمره F1 برای غلبه بر مسئله نامتوازنی افراطی کلاس ها استفاده شده است. بر اساس نتایج تجربی، مدل ماشین بردار پشتیبان به نمره F1، ضریب همبستگی متیوز، فراخوانی و دقتی به ترتیب برابر با 55%، 56%، 78% و 43% بر روی مجموعه آموزشی دست یافت. سرانجام، مدل پیشنهادی بر روی مجموعه آزمایشی کنار گذاشته شده آزمون شد که به نمره F1، ضریب همبستگی متیوز، فراخوانی و دقتی به ترتیب برابر با 50%، 50%، 68% و 40% بر روی مجموعه آزمایشی منجر شد.
۳۷.

مقایسه دقت روش های ماشین بردار پشتیبان و جنگل تصادفی در تهیه نقشه کاربری اراضی و محصولات زراعی، با استفاده از تصاویر چندزمانه سنتینل-2(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ماشین بردار پشتیبان جنگل تصادفی تصاویر چندزمانه سنتینل-2 کاربری اراضی محصولات زراعی

حوزه‌های تخصصی:
تعداد بازدید : ۴۶۰ تعداد دانلود : ۳۳۲
نقشه های پوشش/کاربری اراضی، برای پایش تغییرات عوارض و برنامه ریزی صحیح، هرساله مورد نیاز مدیران حوزه کشاورزی، منابع طبیعی و زیست محیطی است. روش برداشت میدانی با جی پی اس (GPS) و نقشه برداری زمینی مستلزم صرف زمان و هزینه های بسیار است. بنابراین، اغلب از تصاویر ماهواره ای، که دارای پوشش سراسری و توالی برداشت، هزینه کم و اطلاعات به هنگام اند، استفاده می شود تا نقشه های پوشش/کاربری زمین به دست آید. تهیه نقشه دقیق با روش مناسب روز موضوعی کلیدی است. طی سال های اخیر، استفاده از تصاویر ماهواره ای جدید و روش های نوین طبقه بندی، به ویژه یادگیری ماشین، رشد فزاینده ای داشته و کارآیی آنها در تهیه نقشه های پوشش/کاربری اراضی بسیار موفقیت آمیز بوده است. یکی دیگر از مزایای تصاویر ماهواره ای برداشت های متوالی است و براساس آن، می توان از تغییرات پوشش گیاهی در طول زمان، برای تفکیک نوع پوشش، استفاده کرد. ماهواره سنتینل-2، با امتیاز پیکسل 10متری، یکی از ابزارهای مناسب برای تفکیک نوع پوشش محسوب می شود. در این تحقیق، برای تفکیک انواع کاربری اراضی و محصولات زراعی دشت سنجابی روانسر، از تصاویر چندزمانه سنتینل-2 و روش های طبقه بندی ماشین بردار پشتیبان و جنگل تصادفی استفاده و دقت آنها با یکدیگر مقایسه شد. بدین منظور، پس از نمونه برداری، تحلیل مؤلفه های اصلی برای چهار تاریخ دوره رشد محصولات اجرا شد و باندهای PC 1 ، PC 2 و PC 3 تصاویر با هم ترکیب شدند. دو روش روی ترکیب باند های PC 1 ، PC 2 و PC 3 تصاویر و نمونه های تعلیمی اعمال شدند. ارزیابی دقت ها نشان داد ماشین بردار پشتیبان، با صحت کلی 91.36% و ضریب کاپای 0.8927، نقشه کاربری اراضی و محصولات دقیق تری، در قیاس با روش جنگل تصادفی، تولید می کند.
۳۸.

برآورد عملکرد محصولات کشاورزی با استفاده از تصاویر سری زمانی سنتینل 2 (مطالعه موردی: شهرستان زنجان)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: سنجش از دور روش طبقه بندی شبکه عصبی مصنوعی ماشین بردار پشتیبان سنتینل 2

حوزه‌های تخصصی:
تعداد بازدید : ۴۰۹ تعداد دانلود : ۴۵۳
اساس برنامه ریزی و مدیریت صحیح داشتن آمار و اطلاعات دقیق و به هنگام است. یکی از مهم ترین آمار و اطلاعات بخش کشاورزی میزان تولید سالیانه هر محصول یا سطح زیرکشت است. یکی از ابزارهایی که در کمترین زمان و با هزینه پایین و دقت مناسب، می تواند سطح زیرکشت محصولات را محاسبه کند دانش و فنّاوری سنجش از دور است. در این تحقیق، از دو روش طبقه بندی شبکه عصبی مصنوعی و ماشین بردار پشتیبان استفاده شده و سطح زیرکشت محصولات غالب منطقه، شامل هشت کلاس، از تصاویر سری زمانی سنتینل 2 برآورد شده است. براساس نتایج به دست آمده، صحت کلی هریک از روش های شبکه عصبی مصنوعی و ماشین بردار پشتیبان به ترتیب برابر با 97.74 و 97.96%، با ضریب کاپای 0.97 برای برآورد سطح زیرکشت محصولات بوده است. بنابراین، نتایج این دو روش مورد قبول واقع شده است. با توجه به صحت کلی، می توان نتیجه گرفت که دو روش طبقه بندی نتایج تقریباً یکسانی در منطقه دارد. علاوه براین، طبق نتایج صحت کاربر، می توان بیان کرد درمورد چهار محصول یونجه، برنج، پیاز و خربزه، عملکرد روش ماشین بردار پشتیبان بهتر از روش شبکه عصبی است و درمورد گندم دیم و آبی، جارو و مرتع، روش شبکه عصبی بهتر از ماشین بردار پشتیبان در منطقه عمل می کند.
۳۹.

استخراج هوشمند مرز فراداده و متن در پایان نامه های فارسی با رویکرد BA_SVM(مقاله علمی وزارت علوم)

کلیدواژه‌ها: استخراج فراداده استخراج اطلاعات ماشین بردار پشتیبان الگوریتم فرامکاشفهای الگوریتم خفاش

حوزه‌های تخصصی:
تعداد بازدید : ۳۱۰ تعداد دانلود : ۴۳۲
استخراج فراداده باعث تسهیل در فرایند نمایه سازی و بهبود در بازیابی اطلاعات است. از سوی دیگر، خودکارسازی این فرایند سبب افزایش کارایی نسبت به استخراج دستی فراداده هاست. نام دانشجو، نام اساتید، عنوان، رشته و مقطع تحصیلی، چکیده، و کلمات کلیدی نمونه ای از فراداده های پایان نامه است. هدف در این مقاله شناسایی خودکار مرز فراداده و بدنه اصلی در پایان نامه های فارسی است. بدین منظور، 250 پایان نامه ثبت شده در سامانه «ایرانداک» جمع آوری شده است. ویژگی های مد نظر از هر پاراگراف استخراج شده و سپس، پاراگراف های پایان نامه با روش ماشین بردار پشتیبان به دو کلاس فراداده و بدنه طبقه بندی شد. در این پژوهش برای تنظیم پارامترهای الگوریتم ماشین بردار پشتیبان، الگوریتم فرامکاشفه ای خفاش به کار گرفته شده است. نتایج نشان می دهد که روش پیشنهادی با دقت 6/96 درصد نوع پاراگراف را تشخیص می دهد.
۴۰.

مقایسه دو الگوریتم درخت تصمیم گیری و ماشین بردار پشتیبان برای طبقه بندی مکان های جاذب گردشگری بر اساس اطلاعات زمینه ای کاربر(مقاله علمی وزارت علوم)

کلیدواژه‌ها: طبقه بندی زمینه درخت تصمیم گیری ماشین بردار پشتیبان گردشگری

حوزه‌های تخصصی:
تعداد بازدید : ۳۳۴ تعداد دانلود : ۲۳۰
امروزه گردشگری و جذب گردشگر به عنوان یکی از منابع اقتصادی و همچنین بررسی داده های گردشگری با توجه به اهمیت روزافزون صنعت گردشگری و تجارتی و رقابتی شدن این صنعت اهمیت ویژه ای یافته است. در صنعت گردشگری شناخت خصوصیات و اطلاعات زمینه ای کاربر سبب اتخاذ تصمیمات هدفمندتر و ارائه خدمات رضایت بخش تری به کاربر می شود که این امر بدون استفاده از ابزارها و تکنیک های داده کاوی میسر نمی شود. روش های مختلفی برای طبقه بندی و بررسی داده ها وجود دارد. با توجه به اهمیت بالای شناخت رفتار و ویژگی های گردشگران در انتخاب مکان جاذب گردشگری و در نتیجه جلب رضایت گردشگران هدف این مطالعه مقایسه دو الگوریتم درخت تصمیم گیری و ماشین بردار پشتیبان برای طبقه بندی مکان های جاذب گردشگری بر اساس اطلاعات زمینه ای کاربر در نرم افزار Weka است. در این راستا از اطلاعات زمینه ای کاربر ازجمله سن، جنسیت، میزان تحصیلات، نوع مکان گردشگری و امتیازی که کاربران به مکان گردشگری داده اند برای طبقه بندی مکان های جاذب گردشگری استفاده شده است. برای این منظور اطلاعات زمینه ای و اطلاعات مکان های گردشگری از 220 کاربر در مورد جاذبه های گردشگری تهران جمع آوری گردید و برای آموزش و تست دو الگوریتم مورد استفاده قرار گرفته است. با بررسی نتایج این تحقیق با معیارهای مختلف مشخص گردید که درخت تصمیم گیری عملکرد بهتری در مقایسه با روش ماشین بردار پشتیبان بر روی داده-های استفاده شده دارد.