مطالب مرتبط با کلیدواژه
۴۱.
۴۲.
۴۳.
۴۴.
۴۵.
۴۶.
۴۷.
۴۸.
۴۹.
۵۰.
۵۱.
۵۲.
۵۳.
۵۴.
۵۵.
۵۶.
۵۷.
۵۸.
۵۹.
۶۰.
درخت تصمیم
حوزه های تخصصی:
هدف: طبقه بندی ریسک بیمه گذاران بر مبنای ویژگی های قابل مشاهده می تواند به شرکت های بیمه جهت کاهش زیان، شناخت دقیق تر مشتریان و جلوگیری از وقوع انتخاب نامساعد در بازار بیمه کمک شایانی کند. هدف این مقاله، بررسی خسارت های مالی ایجاد شده در بیمه شخص ثالث و پیش بینی ریسک بیمه گذاران در احتمال وقوع حادثه می باشد. روش شناسی: با استفاده از الگوریتم های درخت تصمیم، ماشین بردار پشتیبان، نایو بیز و شبکه عصبی؛ به کشف الگوهای پنهان داده ها، در راستای طبقه بندی بیمه گذاران بیمه شخص ثالث پرداخته شده است. همچنین توزیع نامتعادل داده ها در دو گروه خسارت دیده و خسارت ندیده سبب یک چالش مهم در کاربرد روش های یادگیری ماشین و داده کاوی است که در این مقاله مورد توجه قرار گرفته است. یافته ها: مجموعه داده متعلق به یکی از شرکت های بیمه و حاوی بیش از چهارصد هزار نمونه ثبت شده در پنج سال و شامل چهار متغیر مستقل نوع خودرو، گروه خودرو، نوع پلاک و سن خودرو و یک متغیر وابسته و دو ارزشی خسارت مالی است. با توجه به نتایج بدست آمده بهترین کارکرد و دقت پیش بینی (با دقت F1=) مربوط به مدل درخت تصمیم می باشد. نتیجه گیری: میزان تاثیرگذاری متغیرها در وقوع خسارت به ترتیب اولویت عبارتنداز: نوع خودرو، نوع پلاک، سن خودرو و گروه خودرو. نتایج ارزیابی نشان می دهد برای پیش بینی دقیق تر خسارت و مشتریان پر ریسک به داده های بیشتری مرتبط با ویژگی های راننده نیاز می باشد. طبقه بندی موضوعی:G22, G17, F47
داده کاوی رفتار خریداران مواد غذایی مورد مشهد(مقاله علمی وزارت علوم)
منبع:
اقتصاد کشاورزی دوره ۱۴ پاییز ۱۳۹۹ شماره ۳ (پیاپی ۵۵)
1 - 25
حوزه های تخصصی:
شناخت عامل های اقتصادی- اجتماعی مؤثر بر رفتار خرید مواد غذایی شهروندان از جهات مختلف از جمله برنامه ریزی برای ارتقای رفاه خریداران، هدایت رفتار خرید آتی، هدایت راهبردها و برنامه های تولید و بازاریابی و به تبع آن کاهش هزینه های مازاد و غیرضروری در این مرحله های، جلوگیری از هدررفت منبع های ارزشمند محیط زیستی و منابع طبیعی، کاهش حجم پسماند های مواد غذایی و کاهش هزینه های بلندمدت درمان، دارای اهمیت بسزایی است. در این راستا این پژوهش تلاش کرد با بهره گیری از دانش داده کاوی و الگوریتم C4.5 درخت تصمیم و استفاده از داده ها و اطلاعات 220 خریدار شهر مشهد، الگوریتم های تصمیم سازی خریداران در زمینه انتخاب سلامت، قیمت و طعم مواد غذایی به عنوان اولویت نخست ایشان در هنگام خرید این محصولات را بررسی و ارزیابی کند. نتایج این پژوهش نشان داد که متغیر سن خریداران مهم ترین متغیری است که می تواند بر رفتار خریداران در انتخاب مواد غذایی مؤثر باشد. متغیرهای دیگری نیز در سطح های بعدی بر انتخاب سلامت، قیمت یا طعم ماده غذایی به عنوان اولویت نخست خریداران مواد غذایی مؤثرند که از آن جمله می توان به متغیرهای درآمد خانوار، جنسیت و تحصیلات خریدار و شمار اعضای خانوار اشاره کرد که در طراحی راهبردها و برنامه های بازاریابی محصول ها و فرآورده های غذایی و همچنین تدوین راهبردهای سلامت توسط متولیان امر، بایستی مورد توجه قرار گیرد.
بررسی متغیرهای موثر بر ریسک اعتباری مشتریان حقوقی بانک ها با استفاده از ماشین بردار پشتیبان و درخت تصمیم(مقاله علمی وزارت علوم)
منبع:
چشم انداز مدیریت مالی سال دهم پاییز ۱۳۹۹ شماره ۳۱
53 - 73
حوزه های تخصصی:
افزایش نسبت مطالبات غیرجاری به تسهیلات اعطایی به عنوان شاخص ریسک اعتباری بانک ها می تواند سلامت شبکه بانکی، نظام مالی و اقتصاد حقیقی را به خطر اندازد. از این رو در این مقاله، بررسی این ریسک با استفاده از نسبت مانده واقعی مطالبات غیرجاری و با تمرکز بر مجموعه ای گسترده از متغیرها شامل متغیرهای مالی، غیرمالی، خصوصیتی قراردادها، حسابرسی و اقتصادی، در نمونه ای از 677 پرونده تسهیلاتی مشتریان حقوقی یک بانک دولتی برای سال های 1385 تا 1396 مورد توجه قرار گرفت. براساس نتایج حاصله، در انتخاب متغیرهای تاثیرگذار بر ریسک اعتباری، الگوریتم لاسو با عملکرد بهتر به شناسایی 10 متغیر کلیدی از گروه متغیرهای مالی، اقتصادی و حسابرسی منتهی شد. با این وجود نتایج آموزش این ویژگی ها توسط مدل ماشین بردار و درخت تصمیم که بیانگر بهترین نتایج در قالب الگوریتم لاسو به همراه درخت تصمیم هستند، ضریب اهمیت اندکی را برای متغیرهای حسابرسی در نظر می گیرند. از این رو استفاده از الگوریتم لاسو به همراه درخت تصمیم با تمرکز بر متغیرهای مالی و اقتصادی می تواند از کفایت لازم برخوردار باشد.
تحلیل عوامل فضایی موثر بر مکان گزینی مهاجران با استفاده از روش پیش بینی درخت تصمیم (مطالعه موردی: شهر مشهد)
حوزه های تخصصی:
مهاجرت و جابجایی هایی سکونتی، یکی از پدیده های شهرنشینی است که با ساختار های اجتماعی، اقتصادی و فضایی دارای رابطه علت و معلولی است. این نوع از مهاجرت تحت تأثیر عواملی هم چون نزدیکی به محل کار، مدت سکونت، وضعیت اشتغال، سطح درآمد، سن، جنس و شرایط خانوادگی باشد. از این رو، مکان گزینی محلات و انتخاب محله ای برای سکونت از اهمیت بسزایی برخوردار است و از عوامل بسیاری تأثیر می پذیرد تا جایی که موقعیت مکانی بر مکان گزینی اثر می گذارد. پژوهش حاضر از نظر هدف کاربردی و از نظر روش توصیفی – تحلیلی می باشد. داده های مورد نیاز پژوهش با استفاده از اطلاعات بلوک های آماری سرشماری سال 1390 استخراج شده است. با مطالعه ادبیات تحقیق و تعیین شاخص های مورد نیاز استخراج و به روش تحلیل سلسله مراتبی وزن دهی شده اند. شاخص میانگین مهاجرت به عنوان شاخص هدف و سایر شاخص ها به عنوان شاخص ورودی در درخت تصمیم انتخاب شدند. محاسبات مربوط به درخت تصمیم در نرم افزار کلمنتاین انجام شد. نتایج تحقیق نشان می دهد که میزان تحصیلات بیشترین تأثیر را در مکان گزینی مهاجران در محلات شهر مشهد داشته است. به طور کل 12 شاخص با میزان تأثیر گذاری های متفاوت بر میانگین مهاجرت اثر گذار بوده اند. این درحالی است که هر چه میزان عوامل پیش بینی کننده در این شهر کمتر باشد میزان مهاجرت بالاتر است. هم چنین نتایج نشان می دهد که سیستم داده کاوی با درخت تصمیم قادر خواهد بود تا با اندازه گیری عوامل پیش بینی کننده و میزان تغییرات آن ها، میزان مهاجرت و ماندگاری افراد در محله های شهری را پیش بینی نماید. بنابر نتایج به دست آمده از کارایی این سیستم قابل قبول می باشد.
پیش بینی مدیریت سود با استفاده از شبکه عصبی و درخت تصمیم در شرکت های پذیرفته شده در بورس اوراق بهادار تهران(مقاله علمی وزارت علوم)
منبع:
بررسی های حسابداری و حسابرسی سال ۱۹ تابستان ۱۳۹۱ شماره ۲
31 - 46
حوزه های تخصصی:
هدف اصلی تحقیق حاضر بررسی دقت پیش بینی مدیریت سود با استفاده از شبکه های عصبی و درخت تصمیم گیری و مقایسه آن با مدل های خطی است. برای این منظور از یازده متغیر تأثیرگذار بر مدیریت سود به عنوان متغیرهای مستقل و اقلام تعهدی اختیاری به عنوان متغیر وابسته استفاده شده است. در این تحقیق تعداد 55 شرکت از سال 1385 تا سال 1388 به صورت فصلی مورد بررسی قرار گرفت. از روش رگرسیون پنلی جهت مدل خطی و از شبکه عصبی پیشخور تعمیم یافته و درخت تصمیم کارت جهت بررسی از طریق شبکه عصبی و درخت تصمیم استفاده شد. نتایج حاصل از این تحقیق نشان داد که روش شبکه عصبی و درخت تصمیم در پیش بینی مدیریت سود نسبت به روش های خطی دقیق تر و دارای سطح خطای کمتری است. ضمناً مدیریت سود با متغیرهای اقلام تعهدی اختیاری و غیراختیاری دوره قبل و عملکرد شرکت ، اندازه، تداوم سود در هر دو روش دارای بیشترین ارتباط است.
پیش بینی خرابی ماشین ابزار ساختمان سازی با استفاده از تکنیکهای Data Mining ( کشف دانش در پایگاه داده ها KDD (knowledge discovery in databases)
حوزه های تخصصی:
داده کاوی در واقع یک روش است، یک روش که قرار است به واسطه آن مسئله ای حل شود. این روش بر روی حجم زیادی از داده ها کار می کند و تحلیل مورد نیاز را انجام می دهد، در نهایت یک سری الگوهای تکرارشونده استخراج می شود که می تواند برگ برنده باشد. سپس نوبت به پیدا کردن ارتباطات بین الگوهای مختلف است و در نهایت یک سری راه حل های مهم در این چالش وارد می شوند.ابزار ها ، دستگاه ها و تجهیزات گوناگون در شرکت ها، همواره به عنوان یکی از مهم ترین سرمایه های کارخانه ها به شمار می آید؛ بنابراین با توجه به اینکه هزینه های خرید، نت (نگهداری و تعمیرات) تجهیزات بسیار گران و پرهزینه است و بخش عمده ای از سرمایه ثابت و هزینه های عملیاتی شرکت ها را تشکیل می دهند؛ طبیعی است که یکی از دغدغه های اساسی برای مدیران ارشد در چگونگی به کارگیری و نگهداری بهینه این تجهیزات باشد.تحقیق حاضر (پیش بینی خرابی ماشین ابزار ساختمان سازی با استفاده از تکنیکهای داده کاوی ) به دنبال پیش بینی خرابی ماشین ابزار ساختمان سازی با استفاده از تکنیکهای داده کاوی بود. برای اینکار اطلاعات 50 ماشین ابزار به عنوان نمونه آماری در مدت زمانی مشخص جمع اوری گردید و مورد تجزیه و تحلیل قرار گرفت.در این تحقیق با استفاده از سه تکنیک شبکه عصبی مصنوعی، رگرسیون و درخت تصمیم به پیش بینی زمان خرابی تجهیزات ساختمانی پرداخته شد. متغیرهای ورودی شامل نوع خرابی، تعداد ساعات خرابی، زمان توقف، فاصله بین خرابیها،زمان تعمیر به ساعت و زمان خرابی دستگاه بود. با استفاده از تکنیک شبکه عصبی معادله رگرسیونی یافته شد که با فاصله تقریبا زیاد تغییرات در متغیر وابسته را پیش بینی می کرد. ضریب تعیین بدست آمده برای کل شبکه عصبی مقدار 18 درصد را نشان می دهد که اعتبار بالائی را نشان نمی داد. در بخش درخت تصمیم با استفاده از ند و شاخه و برگ درخت تصمیمی بدست آمد که شرایط را با توجه به مقادیر هریک از متغیرهای تصمیم نشان می داد. در بخش رگرسیون ضریب تعیین 0.98 بدست آمد که نشانگر اعتبار بالای مدل رگرسیون بود ضمن اینکه آماره F و تحلیل واریانس نشانگر معنی داری کلی مدل رگرسیون بود اما زمانی که ضرائب رگرسیون بدست می آید دو متغیر X3 و X5 به دلیل آنکه سطح معنی داری آنها بیش از 0.05 بود و این نشان می داد که آنها در سطح اطمینان 95 درصد بی معنی بودند لذا از مدل خارج شده و صرفا سه متغیر X1و X2 و X4 در معادله رگرسیون قرار داده شدند. نتیجه حاصل نشانگر فاصله بسیار کم بین مدل رگرسیون با حذف دو متغیر x3 و x5 بود و می توان گفت مدل رگرسیون در این تحقیق بهتر می تواند پیشگوی زمان خرابی تجهیزات باشد.
الگویی برای همسوسازی افقی استراتژی های عملیات در صنایع غذایی و شیمیایی با رهیافت داده کاوی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
موفقیت سازمان ها افزون بر تدوین استراتژی، در گرو همسوسازی استراتژی هاست. یکی از حوزه های وظیفه ای مهم که شرکت ها درآن به تدوین استراتژی می پردازند عملیات است. همسویی استراتژی های عملیات را همسویی افقی می گویند. هدف مقاله حاضر ارائه ی الگویی برای همسوسازی افقی استراتژی های حوزه عملیات است. بدین منظور الگوریتمی ابتکاری ارائه شده، با استفاده از آن همسویی افقی استراتژی های عملیات در صنایع غذایی و شیمیایی(شوینده ها) تحلیل شده اند. برای به دست آوردن مدل همسویی، ابتدا با روش توصیفی پیمایشی، نوع استراتژی عملیات مورد استفاده هر شرکت در نمونه ی آماری مشخص شد. سپس با استفاده از روش توصیفی همبستگی، و لحاظ کردن متغیر عملکرد، مدل عملیاتی مناسب همسویی به دست آمد. داده های این مطالعه با استفاده ازروش های داده کاوی (Data mining) و با نرم افزار Clementine از نظر همسویی مطالعه شده اند. نهایت این که در صنایع یادشده همسویی مناسب شناسایی و راهکارهای لازم ارائه شده است.
کشف مشتریان سودآور با رویکرد داده محور(مقاله علمی وزارت علوم)
منبع:
پژوهشنامه بیمه سال سی و ششم پاییز ۱۴۰۰ شماره ۳ (پیاپی ۱۴۳)
85 - 112
حوزه های تخصصی:
هدف : امروزه مشتریان به عامل بسیار مهم و حیاتی در هدایت سرمایه گذاران، تولیدکنندگان و حتی محققان و نوآوران مبدل گشته اند. به همین دلیل، سازمان ها نیاز دارند مشتریان خود را بشناسند و برای آنان برنامه ریزی کنند. در این پژوهش، تلاش شده تا به یکی از اساسی ترین سؤالات سازمان های بیمه ای، یعنی پیش بینی سطح خسارت مشتریان، پاسخ داده شود. روش تحقیق : در پژوهش حاضر از ابزار داده کاوی برای داده های مشتریان صنعت بیمه، بخش بیمه بدنه خودرو از سال 1394 تا 1396 استفاده شده است. تعداد کل داده ها که از ابتدا در این پژوهش مورد استفاده قرار می گیرد بیش از 19356 بوده که در ادامه و در طی آماده سازی آن ها با استفاده از نرم افزار Rapidminer 7.1 تعداد داده هایی که در نرم افزار لحاظ می شود 19356 است. پس از پردازش اولیه تلاش می شود، از بین ۱۵ متغیر موجود در پایگاه داده ویژگی استخراج شود که ملموس باشد و این پژوهش را در هدف خود یاری دهد. بدین منظور با به کارگیری خوشه بندی، رانندگان بر اساس میزان مبلغ خسارت به خوشه های مجزا تقسیم می شوند و ویژگی های هر خوشه بیان می شود. در قسمت خوشه بندی، ابتدا الگوریتم های k-means، k-medoidsو DBSCAN استفاده شده است. سپس الگوریتم های بکار رفته به جهت زمان انجام محاسبات و میزان صحت با یکدیگر مقایسه شدند. یافته ها : در نهایت الگوریتم k-means به عنوان الگوریتم بهینه برای این مجموعه داده انتخاب شد. در انتها به کمک درخت تصمیم مدلی پیش بینی ارایه می شود که شرکت های بیمه را در جهت سودآوری بیشتر و کشف مشتریان سودآور کمک می کند و برای برنامه ریزی و تصمیم گیری های آتی سازمان قابل استفاده است. نتیجه گیری : برای پیش بینی، درخت تصمیم، با میزان صحت 21/86% بهترین مدلی بود که در این پژوهش به آن رسیدیم و در مدل درخت تصمیم ارایه شده معیار درآمد بیمه گذار به عنوان گره ریشه درنظرگرفته می شود که همین نکته نشان دهنده آن است روش بکار رفته می تواند به شرکت های بیمه کمک کند تا با تمرکز بر مشتریان سودآور به درآمد بیشتری برسند. طبقه بندی موضوعی : B31, C38, C22, D12
بررسی رابطه تغییرات پوشش زمین و جزیره حراراتی با استفاده از الگوریتم تک پنجره و روش مفهومی درخت تصمیم (نمونه موردی:شهر اهواز)(مقاله علمی وزارت علوم)
منبع:
جغرافیا و برنامه ریزی سال ۲۵ زمستان ۱۴۰۰ شماره ۷۸
21 - 41
حوزه های تخصصی:
مسئله گرمایش زمین عمده ترین دغدغه جهانی در دهه های اخیر بوده است.شناخت روابط بین پدیده-های تاثیرگذار بر آن می تواند راهگشای کنترل و کاهش پدیده زمین گرمایی باشد.هدف پژوهش تعیین رابطه تغییرات کاربری اراضی ناشی از توسعه شهر و تغییرات دمای سطحی آن و نیز عوامل موثر بر نحوه پراکنش جزایر گرمایی در این شهر است. در این بررسی از تصاویر سنجنده ماهواره لندست، و برای برآورد شاخص پوشش گیاهی از باندمادون قرمز و برای تهیه نقشه تغییرات کاربری از روش مفهومی درخت تصمیم استفاده شد. بنابر یافته های پژوهش، اهواز در دوره 32 ساله 1998تا2020، همراه با گسترش کالبدی زیاد، تغییرات کاربری ها بویژه در رابطه با تغییر پوشش گیاهی در مناطق شرقی شهر را تجربه کرده است. حداکثر دما در این دوره افزایش یافته و جزیره گرمایی از مرکز به سمت حاشیه و اطراف شهر تغییر کرده است. تغییرکاربری اراضی سبز به سایر کاربری ها در شهر اهواز با شکل گیری جزیره حرارتی همراه بوده و دمای سطح زمین در شهر، افزایش4 درجه ای را در ایت دوره نشان می دهد.از نظر فضایی بیشترین افزایش حرارت، مربوط به بخشهای شرق و جنوبغرب و غرب است که علت آن در بخش شرقی تبدیل زمین های کشاورزی و دارای پوشش گیاهی به کاربری صنعتی و در قسمت جنوبغربی به دلیل ایجاد کاربری اراضی ساخته شده طریق طرح های آماده سازی است. بدین ترتیب رابطه افزایش دما با تغییر کاربری پوشش گیاهی به اراضی ساخته شده تایید می شود. رابطه همبستگی شاخص NDBI و NDWIبا دما نیز همین رابطه را تایید کرد. کمترین افزایش دمای حرارتی مربوط به نواحی اطراف رودخانه کارون است که به عنوان یک عنصر تعدیل کننده دما در شهر عمل می کند. به دلیل پربارانی سالهای اخیر کشور و پر آب شدن رودخانه کارون جزیره حرارتی از مرکز شهر به اطراف هدایت شده است. نقشه حرارتی در سال 2020 دمای اطراف رودخانه را کمترین مقدار دمایی نشان می دهد.
داده کاوی وکاوش وضع موجود الگوی مکانی استقرار کاربری های شهری(مقاله علمی وزارت علوم)
منبع:
اطلاعات جغرافیایی سپهر دوره ۳۰ پاییز ۱۴۰۰ شماره ۱۱۹
75 - 86
حوزه های تخصصی:
غالباً در تهیه طرح کاربری اراضی شهری از استانداردها و قواعد مبتنی بر دانش کارشناسی استفاده می شود. اما آنچه که در نهایت در فضای فیزیکی و واقعی شهر اتفاق می افتد، گاهی با قواعد اولیه بنا نهاده شده در تدوین طرح های کاربری اراضی، همخوانی ندارد. در این تحقیق با استفاده از روش داده کاوی تلاش شده است تا با کمک تحلیل های مکانی، روش قواعد انجمنی و درخت تصمیم، به استخراج الگوهای استقرار وضع موجود کاربری های شهری در ناحیه 4 منطقه 5 شهرداری تهران پرداخته شود و میزان تأمین استانداردها و قواعد مبتنی بر دانش کارشناسی با آنچه در وضع موجود شهر وجود دارد، مورد سنجش و تحلیل قرار گیرد. به عنوان نمونه، استخراج قواعد استقرار دبستان در همسایگی 300 متری کاربری های مسکونی با 70 درصد پشتیبان و همچنین مدرسه راهنمایی در همسایگی 1200 متری کاربری های مسکونی با 98 درصد پشتیبان، حاکی از استقرار و انطباق مناسب وضع موجود کاربری های آموزشی سطح محله و ناحیه در منطقه مطالعه موردی است. در حالی که عدم استخراج قواعد مرتبط با کاربری درمانی در منطقه مطالعه موردی، حاکی از عدم استقرار این کاربری در شعاع استقرار مذکور در استانداردهای مرسوم برنامه ریزی کاربری اراضی شهری است.
تحلیل تصادفات جاده ای با تأکید بر خصوصیات محیط و جاده در سیستم اطلاعات مکانی مطالعه موردی: محور کرج– کندوان(مقاله علمی وزارت علوم)
حوزه های تخصصی:
در این مقاله به تحلیل توزیع مکانی و احتمال وقوع تصادفات جاده ای و عوامل مؤثر بر آن ها به ویژه دو عامل محیط و جاده در سیستم اطلاعات جغرافیایی پرداخته شده است. منطقه مورد مطالعه محور کرج- کندوان از محورهای کوهستانی ارتباطی تهران- شمال است. با استفاده از روش سلسله مراتبی درخت تصمیم گیری این پژوهش در چند مرحله انجام گرفت. در مرحله اول منابع موجود مطالعه و نقاط تصادف جمع آوری شد. در مرحله دوم اصلاح نقاط صورت پذیرفت و نقاط نسبت به مبدأ جمع آوری اطلاعات توجیه و به صورت کیلومتر اجرا شد. در مرحله سوم اطلاعات مربوط به شیب جاده، درجه انحنا، نقاط تقاطع، درصد تراکم، اقلیم، و کاربری اطراف منطقه مورد مطالعه جمع آوری و سپس لایه های اطلاعاتی ایجاد، آماده سازی، و استاندارد شد. در مرحله بعد، لایه های استانداردشده توسط مدل درخت تصمیم و درخت تصمیم وزن دار پردازش و ترسیم شد. سپس، با تلفیق لایه ها نقشه احتمال وقوع تصادف در محدوده مطالعاتی تهیه شد. نتایج مطالعات نشان داد که مهم ترین عامل مؤثر در وقوع تصادف با توجه به تحلیل انجام شده متغیر انحناست و متغیرهای تقاطع، اقلیم، تراکم، و شیب در اولویت های بعدی قرار دارند.
طبقه بندی داده های نظرسنجی بیمارستان تأمین اجتماعی شهدای کارگر یزد با الگوریتم درخت تصمیم
منبع:
تامین اجتماعی دوره ۱۶ تابستان ۱۴۰۰ شماره ۳ (پیاپی ۶۰)
111 - 120
حوزه های تخصصی:
هدف: داده کاوی علم و تکنیک هایی است که برای تجزیه وتحلیل داده ها به منظور کشف و استخراج الگوهای ناشناخته قبلی استفاده می شود. همچنین، به عنوان بخش اصلی فرآیند کشف دانش در پایگاه های داده در نظر گرفته می شود. هدف اصلی ما ساخت یک مدل طبقه بندی کارآمد با دقت بالا برای بهبود کارایی و اثربخشی است. روش: در این مقاله یک تکنیک یادگیری نظارت شده به منظور ایجاد یک درخت تصمیم برای داده های نظرسنجی بیمارستان تأمین اجتماعی شهدای کارگر یزد معرفی می کنیم. هدف اصلی ساخت یک مدل طبقه بندی کارآمد با دقت بالا برای بهبود کارایی و اثربخشی فرآیند پذیرش است. برای ساخت درخت تصمیم از الگوریتم CART و بسته rpart موجود در زبان برنامه نویسی R استفاده شده است و مدل نهایی با استفاده از روش های رایج ارزیابی، ارزیابی شد. نتیجه: طبق نتیجه به دست آمده، مهم ترین طبقه (از سمت راست) طبقه اول است؛ زیرا حدود 84 درصد از داده ها را شامل می شود. این طبقه نشان می دهد که اگر میزان رضایت از پزشک بزرگتر یا مساوری 3 و همچنین، میزان رضایت از کارکنان پذیرش بزرگتر یا مساوی 4 باشد، 84 درصد از مراجعه کنندگان در صورت نیاز، مجدداً به بیمارستان مراجعه می کنند.
ارایه الگوریتم درخت تصمیم برای پیش بینی ورشکستگی شرکتهای بورسی
حوزه های تخصصی:
هدف اصلی این تحقیق پیش بینی ورشکستگی شرکتهای با محدودیت مالی با استفاده از درخت تصمیم است. از حیث روش شناسی، این تحقیق در حوزه تحقیقات اثباتی مالی قرار می گیرد. با توجه به این که از اطلاعات تاریخی شرکتهای دارای محدودیت مالی برای پاسخگویی به سؤالات تحقیق استفاده می شود، در گروه تحقیقات شبه آزمایشی قرار می گیرد. همچنین با توجه به ماهیت و روشی که در این تحقیق استفاده می شود، نوعی تحقیق توصیفی پیمایشی و از جهت نوع مطالعه، میدانی آرشیوی و از نظر هدف از نوع تحقیقات کاربردی محسوب می شود. جامعه آماری این پژوهش شامل کلیه شرکت های بورسی از ابتدای سال 1393 تا پایان سال 1399 که دارای محدودیت مالی می باشند که با استفاده از مدل درخت تصمیم پیش بینی شدند. نتایج تحلیل ها نشان داد مدل درخت تصمیم توان پیش بینی ورشکستگی شرکتهای با محدودیت مالی را دارد. همچنین دقت پیش بینی مدل درخت تصمیم در پیش بینی ورشکستگی شرکتهای با محدودیت مالی از عملکرد بالایی برخوردار است و مدل CRT دارای 88.2 قدرت پیش بینی کنندگی است.
بررسی ریزش مشتریان بیمه های زندگی با استفاده از روش های داده کاوی (مطالعه موردی: یکی از شرکت های بیمه ایران)(مقاله علمی وزارت علوم)
منبع:
پژوهشنامه بیمه سال سی و هفتم زمستان ۱۴۰۱ شماره ۴ (پیاپی ۱۴۸)
551 - 566
حوزه های تخصصی:
پیشینه و اهداف: حفظ مشتریان همواره به عنوان مهم ترین شاکله در همه صنایع تلقی می شود و صنعت بیمه نیز از این امر مستثنی نیست. طی سال های اخیر در ایران و با افزایش فروش بیمه نامه های زندگی، حفظ مشتریان بیمه به گونه ای مورد توجه مدیران و صاحب نظران صنعت بیمه قرار گرفته است که با ارائه پوشش های متنوع بیمه ای طیف وسیعی از مشتریان خود را راضی نگه دارد. امروزه، ایجاد حس رضایت در مشتریان بیمه های زندگی توسط شرکت های بیمه یک هنر محسوب می شود و هر چه شرکت بیمه مشتریان بیشتری را راضی نگه دارد، دیگر نگران بازخرید و خارج شدن مشتریان خود نیست. هدف اصلی مقاله، پیاده سازی روش های داده کاوی در پیش بینی ریزش مشتری و شناسایی عوامل تاثیرگذار بر ریزش مشتری در محصولات بیمه زندگی یکی از شرکت های بیمه در ایران است. منظور از پیش بینی ریزش مشتری شناسایی مطلوب طبقه یا کلاس مربوط به بیمه نامه هایی است که قبل از پایان یافتن زمان پوشش بیمه، به درخواست بیمه گذار، متوقف و پایان می یابد. روش شناسی: در مقاله حاضر، سعی شده است با بهره گیری از الگوریتم های داده کاوی مانند جنگل تصادفی، درخت تصمیم، رگرسیون لجستیک و شبکه عصبی به طبقه بندی مشتریان بیمه های زندگی بر اساس ریزش و یا عدم ریزش بپردازیم. داده های مورد استفاده در این تحقیق، شامل اطلاعات بیمه نامه های زندگی یک شرکت بیمه پایلوت در سال 1398 در استان تهران است که سهم مناسب و بالایی در پرتفوی صنعت بیمه دارد. یافته ها: نتایج تحقیق حاکی از عملکرد بالای الگوریتم های جنگل تصادفی، درخت تصمیم ، رگرسیون لجستیک و شبکه عصبی در پیش بینی کلاس مربوط به ریزش مشتریان دارد. براساس نتایج حاصل از تحقیق، احتمال باز خرید در زنان و افراد دارای مشاغل پر ریسک و سن بالاتر، ببشتر است. از طرف دیگر، افرادی که در ابتدا پرداخت حق بیمه را به صورت سالانه، حق بیمه کمتر و درصد ضریب تغییر سرمایه و ریسک سرمایه بیشتری را انتخاب کرده اند، احتمال بازخرید آن ها کمتر بوده است. نتیجه گیری: با توجه به بلندمدت بودن بیمه های زندگی و نیاز به نقدینگی مشتریان با توجه به شرایط اقتصادی، شرکت های بیمه باید توجه بیشتری به مشتریان بیمه های زندگی داشته باشند و ضمن رصد رفتار مشتری در طول بیمه نامه، برنامه های وفاداری به جهت حفظ مشتری را در دستور کار خود قرار دهند.
بررسی وب سایت های شهرداری تهران و ارایه راه کارهای مناسب داده کاوی(مقاله پژوهشی دانشگاه آزاد)
منبع:
دانش شناسی سال دوازدهم پاییز ۱۳۹۸ شماره ۴۶
38 - 50
< p>هدف: هدف اصلی این پژوهش، شناسایی و تجزیه و تحلیل انواع داده های وب سایت شهرداری تهران و ارایه راه کارهای مناسب داده کاوی است. روش پژوهش: این پژوهش بنیادی است و از لحاظ ماهیت می توان آن را تحلیلی در نظر گرفت. روش گردآوری داده های به صورت میدانی بوده است و جامعه آماری 47 سایت که از 220 دامنه شهرداری تهران انتخاب شده است و برای تجزیه و تحلیل از تکنیک های داده کاوی استفاده شده است و منبع گردآوری داده ها وب سنجی و ابزار مورد استفاده گوگل آنالیتیکس می باشد. یافته ها: میزان دقت الگوریتم شبکه عصبی معمولی برابر با 25/99% و در نهایت معیار آر.ام.اس.ای الگوریتم شبکه عصبی معمولی برابر با 159/0 است. میزان دقت الگوریتم درخت تصمیم برابر با 99.80% ؛ معیار ام.اس.ای الگوریتم درخت تصمیم برابر با 003/0 و در نهایت معیار آر.ام.اس.ای الگوریتم درخت تصمیم برابر با 045/0است. میزان دقت الگوریتم کی.ان.ان برابر با 81/99% و در نهایت معیار آر.ام.اس.ای الگوریتم کی.ان.ان برابر با 035/0 است نتیجه گیری: بر اساس یافته های بدست آمده روش دی.بی.اسکن با سایر روش های پایه جهت تجزیه و تحلیل داده های وب سایت های شهرداری تهران برابر و نسبت به سایر روش ها از دقت بالاتری برخوردار است.
تشخیص بیماری عروق کرونر قلبی با استفاده از الگوریتم فراابتکاری شاهین هریس و روش های یادگیری ماشین(مقاله پژوهشی وزارت بهداشت)
مقدمه: روش های تشخیص بیماری های عروق کرونر معمولاً در معرض خطا بوده و برای بیمار رنج آور و هزینه بر است. بنابراین، توسعه و ارائه روش های یادگیری ماشین با دقت بالا در تشخیص بیماریهای عروق کرونر از اهمیت خاصی برخوردار است. هدف این پژوهش کمک به تشخیص بیماری عروق کرونری با استفاده از الگوریتم شاهین هریس و روش های یادگیری ماشین می باشد. روش ها: در این پژوهش از روش جدید مبتنی بر انتخاب ویژگی توسط شاهین هریس در حالت ترکیبی با روش یادگیری ماشین شامل درخت تصمیم و کای نزدیک ترین همسایه استفاده شد. که جهت ارزیابی روش پیشنهادی از دو مجموعه داده با پرونده پزشکی 303 بیمار در مجموعه داده Cleveland و Z-Alizadeh-Sani استفاده گردید. ارزیابی مدل پیشنهادی در پایتون نسخه 2016 انجام شد. یافته ها: بر اساس یافته ها انتخاب ویژگی با استفاده از الگوریتم شاهین هریس در حالت ترکیبی با روش یادگیری ماشین منجر به افزایش دقت در نتایج شد. به طوری که در مجموعه داده Z-Alizadeh-Sani درصد دقت در ترکیب با درخت تصمیم برابر با 0/98 و در ترکیب با کای نزدیک ترین همسایه برابر با 0/78 بود. همچنین، در مجموعه داده Cleveland درصد دقت در ترکیب با درخت تصمیم برابر با 0/88 و در ترکیب با کای نزدیک ترین همسایه برابر با 0/77 بود. این در حالی است که هریک از این مقادیر در حالت تمام ویژگی ها مقادیر کمتری از دقت را دارا بود. بنابراین، الگوریتم شاهین هریس در ترکیب با درخت تصمیم توانست به بالاترین دقت تشخیص بیماری عروق کرونر در حالت انتخاب ویژگی نسبت به کل ویژگی ها دست یابد. نتیجه گیری: نتایج این مطالعه به خوبی نقش فرآیند انتخاب ویژگی های مؤثر در تشخیص بیماری عروق کرونر توسط الگوریتم شاهین هریس در ترکیب با روش های یادگیری ماشین را نشان داد.
تعیین عوامل مؤثر بر مرگ ومیر بیماران سوختگی با استفاده از الگوریتم داده کاوی درخت تصمیم(مقاله پژوهشی وزارت بهداشت)
منبع:
مدیریت سلامت دوره ۱۶ زمستان ۱۳۹۲ شماره ۵۴
۴۵-۳۴
حوزه های تخصصی:
مقدمه: در سال های اخیر استفاده از روش های داده کاوی روی حجم زیادی از داده ها با هدف تولید مدل ها و الگوهای پیش بینی کننده در حیطه های متعدد پزشکی رواج یافته است. در این مطالعه پژوهشگران قصد دارند با استفاده از الگوریتم داده کاوی درخت تصمیم، عوامل موثر بر مرگ ومیر بیماران سوختگی را مشخص نمایند. روش کار: این پژوهش توصیفی گذشته نگر است که مبتنی بر اطلاعات پرونده های بیمارستانی می باشد. در مجموع 4804 پرونده پزشکی مربوط به بیماران سوختگی، مورد بررسی قرار گرفت. داده های گردآوری شده با استفاده از نرم افزارهای تحلیل آماری SPSS-16 و داده کاوی Clementine-12 و از طریق الگوریتم (Chi-squared Automatic Interaction Detection: CHAID) مورد تجزیه و تحلیل قرار گرفتند. یافته ها: مدل پیش بینی فوت و زنده ماندن برای بیماران سوختگی که کارایی آن توسط پژوهشگران اثبات گردید، به ترتیب اهمیت شامل درصد سطح سوختگی، درجه سوختگی، مدت زمان بستری، جنسیت و سن می باشد. سایر متغیرهای مورد مطالعه شامل کشت خون، کشت زخم، کشت ادرار، عامل سوختگی و ماه بستری بیمار در کارایی مدل تاثیری نداشتند. نتیجه گیری: با توجه به میانگین دقت مدل پیشنهادی(تقریباً 95درصد) و میانگین دقت مدل روی داده های آزمون(تقریباً 95درصد)، مدل پیشنهادی معتبر و قابل استناد می باشد. در حقیقت، نتایج این مطالعه یک مدل جامع، دقیق و معتبر پیش بینی فوت و زنده ماندن بیماران سوختگی را بر اساس متغیرهای فوق الذکر که بعضی از آن ها با نتایج سایر پژوهشگران مطابقت دارد پیشنهاد می کند. لذا چنین مدلی می تواند به عنوان یک معیار مهم ارزیابی جهت درمان موثر بیماران سوختگی مورد استفاده قرار بگیرد.
شناسایی عوامل مرتبط با طول مدت اقامت بیمارستانی با استفاده از درخت تصمیم(مقاله پژوهشی وزارت بهداشت)
منبع:
مدیریت سلامت دوره ۱۸ پاییز ۱۳۹۴ شماره ۶۱
۶۸-۵۷
حوزه های تخصصی:
مقدمه:یکی از عوامل اصلی هزینه های بیمارستانی طول مدت اقامت می باشد که باعث محدودیت منابع در بیمارستان می گردد. شناسایی عوامل مرتبط با این شاخص جهت بهره بردای بهینه از منابع و کاهش مدت اقامت ، می تواند مفید باشد. مطالعه حاضر با هدف بررسی عوامل مرتبط با طول مدت اقامت با استفاده از اعمال درخت تصمیم بر روی داده های پذیرش بیمارستان انجام شد. روش کار:این مطالعه از نوع توصیفی گذشته نگر است. نمونه های مورد مطالعه از 188068 پرونده ی کامپیوتری بیماران بستری در تمام بخش های بیمارستان قائم(عج) مشهد شامل 16 متغیر و در بازهی زمانی ابتدای سال 1388 تا انتهای سال 1392 خورشیدی استخراج شد. پس از پاکسازی داده ها، جهت تعیین عوامل مرتبط با طول مدت اقامت، از تحلیل تک متغیره شامل تست های آماری کای دو و تحلیل واریانسیک طرفه و همچنین الگوریتم درخت تصمیم CHAIDدر نرم افزار SPSS نسخه 19 استفاده گردید. یافته ها:میانگین مدت اقامت در بیمارستان مورد مطالعه 5/6 با میانه چهار روز بوده است. از بین 15 متغیر مستقل وارد شده به درخت تصمیم، 11 متغیر شامل بخش بستری، سن، دلیل مراجعه، پزشک معالج، نحوه مراجعه، شغل، وضعیت تأهل، نوع محل زندگی، داشتن همراه، روز پذیرش در هفته، و نوع بیمه، به عنوان عوامل مرتبط با LOS شناخته شدند. نتیجه گیری:نتایج تکنیک های داده کاوی می تواند بر اساس داده های ورودی متفاوت باشد، لذا جهت آگاهی از عوامل مرتبط با طول مدت اقامت لازم است داده های مربوط به هر بیمارستان به طور جداگانه وارد مدل شده و از نتایج بهدست آمده، در همان بیمارستان استفاده شود.
ارائه مدلی برای پیش بینی نوع صافی همودیالیز با تکنیک های داده کاوی(مقاله پژوهشی وزارت بهداشت)
منبع:
مدیریت سلامت دوره ۲۰ بهار ۱۳۹۶ شماره ۶۷
۱۱۰-۹۹
حوزه های تخصصی:
مقدمه: دیالیز ناکافی به عنوان یک عامل خطر مرگ و میر برای بیماران کلیوی، ضرورت وجودالگویی برای کمک به پرسنل بخش دیالیز جهت ارائه خدمات درست به بیماران دیالیزی و مدیریت صحیح درمان آن ها را نشان می دهد. پژوهش حاضر با هدف شناسایی الگویی برای تشخیص نوع صافی همودیالیز صورت گرفته است زیرا نقش نوع صافی در کفایت دیالیز تعیین کننده می باشد. مواد و روش ها: پژوهش حاضر به روش توصیفی- مقطعی صورت گرفته و نمونه گیری به روش سرشماری بوده است. جامعه ی پژوهش متشکل از داده های بیمارستان علی ابن ابی طالب (ع) زاهدان در خردادماه 95 است که با مراجعه مستقیم پژوهش گر به سازمان حاصل و به صورت فایل اکسل تهیه گردید. جهت تحلیل داده ها از نرم افزار Clementine12.0 استفاده شده است. در پژوهش حاضر الگوریتم های درخت تصمیم و شبکه عصبی اجرا گردیدند. یافته ها: مقدار صحت بدست آمده از اجرای الگوریتم های C5.0 ،C&R Tree، CHAID، QUEST و شبکه عصبی به ترتیب 9263/0، 9047/0، 8872/0، 8720/0 و 8754/0 می باشد. مقادیر بدست آمده برای شاخص های حساسیت، شفافیت، صحت، دقت، NPV، FM، GM، FPR، FNR، FDR و ER و نیز سطح زیر منحنی ROC برای مدلC5.0 نشان دهنده عملکرد بهتر این الگوریتم نسبت به سایرین می باشد. نتیجه گیری: مقادیر بیشتر برای 7 شاخص اول نشان می دهد که طبقه بند مورد استفاده نمونه های بیشتری را در جای درست خود طبقه بندی کرده و مقادیر کم 4 شاخص آخر وقوع خطای کمتر در طبقه بندی نمونه ها را تایید می نماید. مدل C5.0 در 7 شاخص اول بیشترین مقدار و در 4 شاخص آخر کمترین مقدار را دارد. مدل ارائه شده به پیش بینی دقیق تر نوع صافی همودیالیز و نیز مدیریت صحیح درمان بیماران کمک می نماید.
ارائه الگوی ترکیبی داده کاوی برای سنجش افت فشار خون بیماران همودیالیزی(مقاله پژوهشی وزارت بهداشت)
منبع:
مدیریت سلامت دوره ۲۱ زمستان ۱۳۹۷ شماره ۷۴
۱۸-۹
حوزه های تخصصی:
مقدمه: افت فشار خون حین دیالیز در بیمارانی که به مدت طولانی تحت دیالیز قرار می گیرند، اغلب با افزایش مرگ و میر همراه است. پژوهش حاضر با هدف سنجش میزان افت فشارخون بیماران همودیالیزی به ارائه مدلی پیش بینانه از طریق داده کاوی توصیفی پرداخته است. زیرا، افت فشار خون شایع ترین عارضه جدی حین همودیالیز است. روش ها: پژوهش حاضر به روش توصیفی- مقطعی صورت گرفته است. جامعه ی پژوهش متشکل از داده های بیمارستان علی ابن ابی طالب (ع) زاهدان در خردادماه ۹۵ است. جهت تحلیل داده ها از نرم افزار Clementine۱۲.۰ استفاده شده است. برای مدل سازی از الگوریتم های K-Means، C۵.۰ و CART استفاده گردید. یافته ها: پارامترهای تاثیرگذار در میزان افت فشار خون شامل نوع صافی و دور پمپ بود. بررسی خوشه بندی و قوانین استخراج شده از مدل، اهمیت تاثیر نوع صافی و دور پمپ را تصدیق نمود. نتیجه گیری: استفاده از رو ش های نوین مدل سازی برای تحلیل وکشف ارتباطات بین داده های دیالیز، باعث ایجاد تغییر در نحوه ی نگرش پرسنل بخش دیالیز نسبت به روند انجام دیالیز و مراقبت های لازم حین آن می شود. سنجش میزان افت فشار خون بیماران دیالیزی به شناسایی سریع تر و دقیق تر افت فشار و مدیریت صحیح و پیشگیرانه کمک می نماید و منجر به ارتقای عملکرد بخش دیالیز می گردد. مطالعه حاضر نشان داد نوع صافی به جهت تاثیر آن روی افت فشار خون بیمار اهمیت دارد.