مطالب مرتبط با کلیدواژه
۱.
۲.
۳.
۴.
۵.
۶.
۷.
۸.
۹.
۱۰.
۱۱.
۱۲.
۱۳.
۱۴.
۱۵.
۱۶.
۱۷.
۱۸.
۱۹.
۲۰.
درخت تصمیم
حوزه های تخصصی:
طراحی مدل انتخاب نیروی انسانی با رویکرد داده کاوی (مورد: استخدام داوطلبان آزمون های ورودی یک بانک تجاری در ایران)(مقاله علمی وزارت علوم)
حوزه های تخصصی:
موفقیت یا شکست سازمان، ارتباط مستقیمی با چگونگی جذب و نگهداری منابع انسانی آن دارد. اغلب در رابطه با برگزاری آزمون های ورودی و فرآیند جذب کارکنان، داده ها و اطلاعات فراوانی در سازمان ها وجود دارد که بدون استفاده قرار می گیرند. داده کاوی،به عنوان راه حل برای چنین مسایلی است. در این پژوهش که از حیث هدف، کاربردی و از جنبه ماهیت از نوع پژوهش های همبستگی و همخوانی محسوب میشود، سعی شده است که با استفاده از تکنیک های داده کاوی، قواعد و روابط بین نمرات آزمون های ورودی و سایر متغیرهای شخصی و شغلی (که قبل از ورود هر کس به سازمان مشخص می شود) و وضعیت کارکنان با عملکرد شغلی و وضعیت ارتقاء آنان شناسایی شود. درنتیجه با مطالعه و بررسی پایگاه های داده-ی آزمون و منابع انسانی یک بانک تجاری برای 2 سال متوالی (1383 و 1384)، شاخص های نیروی انسانی که بر عملکرد یا ارتقاء موثر بودند، شناسایی شدند. تکنیک داده کاوی مورد استفاده در این پژوهش، درخت تصمیم گیری است و استخراج قواعد نیز با استفاده از الگوریتم های QUEST، CHAID، C5.0 و CART انجام شده است. در نهایت ضمن ارایه مدلی جهت انتخاب متغیرهای تاثیرگذار، متغیر هدف و الگوریتم های مناسب؛ از بین قواعد به دست آمده، قواعد غیربدیهی مشخص و علت وجود این قواعد با کمک خبرگان تبیین شده است. از جمله نتایج ، حذف متغیر ارزیابی عملکرد به عنوان متغیر هدف در روند این پژوهش است که ناشی از عدم دقت تکمیل فرم های ارزیابی عملکرد در فرآیند ارزیابی بانک بوده است. هم چنین در این پژوهش مشخص شده است از مجموع 26 متغیر بررسی شده، پنج متغیر: «نمره ی کل آزمون»، «امتیاز مصاحبه»، «مقطع تحصیلی»، «تجربه حرفه ای» و «استان محل خدمت» بر ارتقای داوطلبان تاثیرگذار بوده اند. این نتایج منجر به دانشی شده است که امکان کاربردی نمودن آن ها وجود خواهد داشت.
مقدمه ای بر مطالعات کمی در مدیریت (مورد مطالعه: کاربرد داده کاوی در مطالعات مدیریت)(مقاله پژوهشی دانشگاه آزاد)
حوزه های تخصصی:
داده کاوی، فرایند مرتب سازی و طبقه بندی داده های حجیم و آشکارسازی اطلاعات مرتبط باهم می باشد. امروزه داده کاوی به عنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیق تر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، داده های موجود در سازمان با بکارگیری ابزارهای نرم افزاری، مورد بررسی و تحلیل دقیق قرار می گیرد تا الگوهای پنهان و پیچیده ای که در آنها وجود دارد کشف و استخراج گردد. داده کاوی را می توان نسل سوم تکنولوژیهایی نامید که با داده سروکار دارند. در نسل اول یا نسل سنتی، فقط انجام پرس و جو های ساده امکان پذیر بود، مثلا تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظه ای برخط (OLAP) امکان پرس و جوی همزمان چند بعدی فراهم گردید. در این روش به عنوان مثال به سوالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟ » بصورت لحظه ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می شود. اما در نسل سوم یا همان داده کاوی فقط مساله پرس و جو و دریافت گزارش ها از داده ها نیست، بلکه از حجم انبوه داده ها، الگوهایی کشف می شود که هیچ وقت امکان کشف این الگوها در OLAP یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق داده کاوی بدست می آیند و کاربرد دارند عبارتند از: وابستگی، تسلسل و توالی، طبقه بندی، خوشه بندی و پیش بینی. برای استخراج این الگوها اغلب از روشهای نوینی مانند شبکه عصبی و درختهای تصمیم استفاده می شود. در عمل برای امکان انجام داده کاوی و استفاده از تکنیکهای فوق الذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبارداده در حقیقت پایگاه داده ای است که داده های جاری و همچنین سوابق قبلی تراکنشها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار می کند.
اهداف کلی این مقاله عبارتند از ارایه تعریف دقیقی از انبار داده، بررسی تکنیکها و کاربردهای داده کاوی و کاربرد آن در مدیریت، معرفی شبکه عصبی به عنوان یکی از روشهای اجرای داده کاوی و بیان مفهوم درخت تصمیم و ارتباط آن با داده کاوی.
تعیین راهبردهای نوین بانکداری در میزان پذیرش کاربران سرویس بانکداری همراه در بانک های خصوصی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
بانکداری همرا ه امکانی است که در بسیاری از کشورها فراهم شده است این نوع پرداخت به دلیل راحتی استفاده ، دست یابی همگانی و سریع به گوشی های تلفن همراه و استفاده دائمی افراداز آنها مورد توجه می باشد. از طرفی امروزه برنامه ریزی راهبردی در بخش خصوصی توسعه یافته است. رویکردهای برنامه ریزی راهبردی که در بخش خصوصی تدوین شده اند می توانند به سازمانهای خصوصی و غیرانتفاعی و هم چنین جوامع و دیگر نهادها کمک نمایند. بانک های خصوصی نیز یکی از این سازمان های خصوصی می باشند. از طرفی دیگر نگرانیهای زیادی در مورد تأثیر بانکداری همراه و ارائه خدمات به صورت الکترونیکی بر پذیرش مشتریان وجود دارد. در تحقیق حاضر، پذیرش در قالب پارامترهایی از قبیل استفاده، دردسترس بودن، سرعت و امنیت تعریف می گردد که به خصوصیات فردی شامل جنس، سن، درآمد، سطح تحصیلات، استفاده از اینترنت، توجه به تبلیغات و بالاخره میزان خطر پذیری افراد وابسته است. هدف اصلی در این مقاله کشف روابط میان میزان پذیرش سرویس بانکداری همراه با تفاوت های فردی است که این نتایج سبب تعیین راهبردهای بانکداری در جهت جذب مشتری هایی با پتانسیل بیشتر میشود. داده های مورد نیاز مقاله با پرسش از کاربران سرویس بانکداری همراه بانک های خصوصی در ایران و تجربیات مدیران در سازمانهای مدیریت و برنامه ریزی کشور جمع آوری شده است. برای تجزیه و تحلیل داده ها از روش های هوشمندانه داده کاوی و درخت تصمیم استفاده گردیده است. یافته های پژوهش نشان میدهد که عامل ریسک پذیری مشتریان در پذیرش سرویس بانکداری همراه تأثیر معناداردارد
ارائه چهارچوب برای پیش بینی سطح خسارت مشتریان بیمه بدنه اتومبیل با استفاده از راهکار داده کاوی
حوزه های تخصصی:
امروزه مشتریان به عامل بسیار مهم و حیاتی در هدایت سرمایه گذاران، تولیدکنندگان و حتی محققان و نوآوران مبدل گشته اند. به همین دلیل سازمان ها نیاز دارند مشتریان خود را بشناسند و برای آنان برنامه ریزی کنند. تاکنون برای شناسایی مشتریان و به خصوص شناسایی رفتار آنها روش هایی استفاده شده که از جمله می توان روش های آماری را معرفی کرد که البته محدودیت ها و مشکلاتی دارد. در این پژوهش با استفاده از روش های داده کاوی، چهارچوبی را برای شناسایی مشتریان (با تمرکز بر مشتریان بیمه بدنه اتومبیل) ارائه می کنیم. به منظور کاهش خطاها و محدودیت ها از دو روش درخت تصمیم و خوشه بندی، به صورت مکمل استفاده کرده ایم. ابتدا با استفاده از تکنیک خوشه بندی، مشتریان را براساس ویژگی هایشان خوشه بندی کرده و سطح خسارت هرکدام از این خوشه ها را محاسبه کردیم. سسپس مشتریان آتی را براساس ویژگی هایشان و تکنیک درخت تصمیم در یکی از این خوشه ها دسته بندی نمودیم. دسته ای که مشتری در آن قرار گرفته معرف سطح خطرپذیری اوست. با استفاده از این معیار و نوع بیمه نامه مشتری می توان میزان خسارت او را پیش بینی کرد. البته برای تعیین صحت نتایج، مدل ها را ارزیابی کرده و با یکدیگر مقایسه کردیم. شایان ذکر است تکنیک درخت تصمیم برای این منظور نتایج بهتری را حاصل نمود ولی تکنیک خوشه بندی نیز تفکیک خوبی میان مشتریان ایجاد می کند.
دسته بندی مشتریان بیمه با استفاده از داده کاوی
حوزه های تخصصی:
امروزه نقش مشتریان از حالت پیروی از تولیدکننده، به هدایت تولیدکنندگان مبدل گشته است، به همین دلیل دسته بندی مشتریان، در هدفمند ساختن سازمان ها در سفارشی سازی خدمات شان و نیز الویت بندی محصولات براساس میزان سودآوری آن محصول کمک شایانی میکند. روش داده کاوی برای دستیابی به قوانین تصمیم گیری و مدل پیش بینی رفتار مشتریان آتی در کیی از شرکت های بیمه استفاده شده است. در اجرای روش دسته بندی در داده کاوی، دو تکنیک درخت تصمیم و شبکه های عصبی در یکی از شرکت های بیمة خصوصی به کاررفته است. هدف این پژوهش استفاده از روش شبکه های عصبی و تکنیک درخت تصمیم به منظور دسته بندی مشتریان بیمه و درنهایت ارزیابی نتایج به دست آمده است. به منظور ارزیابی مدل ها، نتایج حاصل از دو مدل را مقایسه کردیم که تطابق آنها نشان دهندة صحت عملکرد مدل هاست. البته بررسی ها نشان داده اند که روش درخت تصمیم نتایج بهتری را دربرداشته است و این بدان معنی است که روش درخت تصمیم، روش مناسب تری برای دسته بندی مشتریان بیمه ایجاد میکند. همچنین نتایج به دست آمده از این تحقیق، توسط خبرگان صنعت بیمه تأیید و نظرات آنها به شکل توضیحی از مشخصه ها یا متغیرهای ورودی تحقیق ارائه شده است.
مقایسه روش های طبقه بندی پیکسل پایه، شئ پایه و درخت تصمیم در تهیه نقشه تیپ های جنگل با استفاده از داده های سنجش از دور (مطالعه موردی: جنگل آستارا)
حوزه های تخصصی:
نقشه های قابل اعتماد از تیپ جنگل ها نقش مهمی در اتخاذتصمیمات بهینه برای مدیریت اکوسیستم های جنگلی در نواحی وسیع ایفا می کنند. در سال های اخیر تهیه این نقشه ها از طریق طبقه بندی رقومی داده های سنجش از دور به عنوان جایگزینی مناسب موردتوجه قرار گرفته است. نتایج حاصله در این زمینه برحسب روش های طبقه بندی مورداستفاده، وضعیت پوشش جنگلی، شرایط منطقه موردمطالعه و داده های بکار گرفته شده متفاوت بوده است. هدف از این تحقیق، مقایسه روش های طبقه بندی پیکسل پایه و شئ پایه و درخت تصمیم برای تهیه نقشه تیپ های جنگل با استفاده از تصویر ماهواره ای SPOT5 در محدوده ای از جنگل آستارا واقع در شمال ایران است. اطلاعات زمینی با استفاده از 153 پلات به صورت تصادفی درمساحت های یک هکتاری تهیه گردید. نوع تیپ در هر پلات بر اساس درصد فراوانی کل نوع گونه ها تعیین شد و شامل تیپ های انجیلی آمیخته، پهن برگ مخلوط، ممرز آمیخته، راش آمیخته و حفاظتی بود. برای تهیه نقشه این تیپ ها، در روش پیکسل پایه با استفاده از داده های طیفی و طبقه بندی کننده شبکه عصبی، صحت کلی 04/52 درصد و ضریب کاپای 39/0 حاصل شد و در روش طبقه بندی شئ پایه با روش نزدیکترین همسایه و توابع فازی، صحت کلی 3/63 درصد و ضریب کاپای 54/0 بدست آمد. به دلیل تشابه طیفی تیپ های آمیخته جنگل و تفکیک پذیری پائین آنها از یکدیگر در محدوده باندهای طیفی از اطلاعات بافت و داده های توپوگرافی موثر در پراکنش مکانی تیپ ها شامل ارتفاع، جهت، شیب و فاصله از شبکه آبراهه برای کلاسه بندی تیپ های آمیخته جنگل استفاده گردید. بکارگیری داده های کمکی در روش های طبقه بندی پیکسل پایه و شئ پایه حاکی از مفید بودن مدل رقومی ارتفاع در مقایسه با سایر داده های کمکی در تفکیک تیپ ها داشت. استفاده از داده های مربوط به فاکتورهای محیطی بعنوان متغیرهای کمکی در کنار داده های طیفی در روش درخت تصمیم به صحت کلی 5/76 درصد و ضریب کاپای 7/0 در تفکیک تیپ های آمیخته جنگل منجرشد که نشان دهنده افزایش قابل ملاحظه صحت می باشد. مقایسه نتایج حاصل از روش های طبقه بندی بکار گرفته شده در این تحقیق بیانگر پتانسیل بالای روش شئ پایه در بکارگیری داده های طیفی برای کلاسه بندی تیپ های آمیخته جنگل در مقایسه با روش طبقه بندی پیکسل پایه بود. همچنین تیپ های آمیخته جنگل با استفاده از داده های کمکی در کنار داده های طیفی با روش درخت تصمیم بهتر از روش های پیکسل پایه و شئ پایه در محدوده مطالعه تفکیک شد.
استفاده از روش های داده کاوی برای پیش بینی سطح خسارت مشتریان بیمه بدنه اتومبیل(مقاله علمی وزارت علوم)
منبع:
پژهشنامه پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات سابق) دوره ۲۷ بهار ۱۳۹۱ شماره ۳ (پیاپی ۶۹)
حوزه های تخصصی:
: امروزه، نقش مشتریان از حالت پیروی از تولیدکننده، به هدایت سرمایه گذاران، تولیدکنندگان و حتی پژوهشگران و نوآوران مبدل گشته است، به همین دلیل سازمان ها نیاز دارند مشتریان خود را بشناسند و برای آنان برنامه-ریزی کنند. تاکنون از برخی روش های آماری و یادگیری ماشینی برای این منظور استفاده شده است که البته این روش ها به تنهایی دارای محدودیت هایی هستند که در این پژوهش سعی شده است تا با بهره گیری از روش های مختلف داده کاوی تا حد ممکن این محدودیت ها از بین برده و برطبق آن، چارچوبی برای شناسایی مشتریان بیمه بدنه اتومبیل ارائه شود. درواقع، هدف این است تا مشتریانی را که بیشتر به یکدیگر شبیه هستند دسته بندی و با استفاده از این دسته ها و ویژگی های آن، میزان خطرپذیری هر دسته را پیش بینی کرد. حال با استفاده از این معیار (میزان خطرپذیری هر دسته) و نوع بیمه نامه مشتری می-توان میزان خسارت او را پیش بینی کرد که این معیار می تواند کمک شایانی برای شناسایی مشتریان و سیاستگذاری های تعرفه بیمه نامه باشد. برای این منظور، از دو روش داده کاوی4، درخت تصمیم و خوشه بندی برای ایجاد مدل پیش بینی خطرپذیری مشتریان در صنعت بیمه استفاده شده است. البته فنّ درخت تصمیم برای این منظور نتایج بهتری را به دست آورده است، ولی فنّ خوشه بندی نیز تفکیک خوبی میان مشتریان ایجاد می کند.
شناسایی تقلب در بیمة اتومبیل بااستفاده از روش های دادهکاوی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
تقلب های بیمه ای از مسائل مهم و خسارت زا برای شرکت های بیمه و بیمه گذاران، در تمام رشته های بیمه ای است. یکی از راه های شناسایی تقلب در خسارت های اعلام شده، استفاده از اطلاعات تقلب های کشف شده در گذشته است. امروزه روش های داده کاوی به طور گسترده در کشف الگوها در داده ها استفاده می شوند. استفاده از این روش ها میتواند در شناسایی خسارت های تقلبی در صنعت بیمه مفید باشد. در این مقاله ضمن بررسی روش های رایج برای شناسایی تقلب در بیمة اتومبیل از سه روش داده کاوی رگرسیون لجستیک، بیز ساده و درخت تصمیم برای پیداکردن الگوهایی استفاده شده است که به شرکت های بیمه در شناسایی تقلب ها در بیمه اتومبیل کمک می کنند. همچنین در یک مطالعة تجربی این روش ها بر روی داده های واقعی (شامل اطلاعات 72 پروندة خسارت بیمه نامه های شخص ثالث و بدنة اتومبیل) آزمایش و کارایی هر روش سنجیده شد. روش بیز ساده با دقت 28/90 درصد در شناسایی صحیح جعلی یا غیرجعلیبودن پرونده های خسارت بهترین کارایی را در مقایسه با دو روش درخت تصمیم با دقت 9/88 درصد و رگرسیون لجستیک با دقت 1/86 درصد داشت.
به کارگیری الگوریتم های درخت تصمیم گیری جهت کشف رفتارهای مشکوک در بانکداری اینترنتی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
دگرگونی جهان به واسطه گسترش فناوری اینترنت، رقابتی دانش محور را در عرصه تجارت الکترونیکی به وجود آورده است. به طوری که با افزایش نرخ مبادلات تجاری، تضمین امنیت، منوط به تحقق نظام پویای بانکداری الکترونیکی است. بانکداری اینترنتی به عنوان یک فرصت بالقوه و رکن اساسی، در فضای سایبر با تهدیدهای گوناگونی مواجه است که یکی از این چالش ها، عدم قطعیت در تضمین امنیت تراکنش ها و وجود رفتارهای غیرمتعارف از سوی شیادان الکترونیکی است. از آنجایی که رفتار کاربران در سامانه اینترنتی با عدم قطعیت همراه بوده و سوابق تراکنش ها، تنها راه کنترل این حرکات است، دانش استنتاجی خبرگان و دسته بندی الگوی رفتاری کاربران توسط الگوریتم درخت تصمیم ، جهت کشف تقلب و رفتارهای مشکوک راهگشاست. در این مقاله، ابتدا متغیرهای مؤثر در تولید قوانین رفتاری تعیین شده است و در نهایت، روند چهار الگوریتم Chaid، ex_Chaid، C4.5 و C5.0 مورد مقایسه قرار گرفته است. نتایج پژوهش نشان می دهد که الگوریتم C5.0 با دقت 91 درصد می تواند به عنوان روش ماشینی مطمئن جهت کشف الگوهای مشکوک موجود روی تراکنش های بانک محسوب شود.
پیش بینی ورشکستگی شرکت های پذیرفته شده در بورس اوراق بهادار تهران با استفاده از درخت تصمیم و رگرسیون لجستیک(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هدف اصلی این مقاله پیش بینی ورشکستگی اقتصادی شرکت ها در بورس اوراق بهادار تهران با استفاده از درخت تصمیم (CART) و رگرسیون لجستیک است که از تکنیک های داده کاوی هستند و می توانند به امر پیش بینی کمک کنند. نسبت های مالی به عنوان متغیرهای مستقل و شرکت های سالم و ورشکسته به عنوان متغیر وابسته پژوهش استفاده شده است. جامعه آماری اطلاعات صورت های مالی شرکت ها در بورس اوراق بهادار تهران طی سال های 1378تا 1389 است. در این پژوهش از نمونه گیری استفاده نشده است و شرکت ها شامل دو گروه سالم و ورشکسته است گروه ورشکسته بر مبنای ماده 141 قانون تجارت و زیان خالص انتخاب شده اند و گروه غیر ورشکسته بر اساس معیار سود دهی انتخاب شده اند. یافته های تحقیق حاکی از آن است که هر دو مدل درخت تصمیم و رگرسیون لجستیک توانایی پیش بینی ورشکستگی را با دقت های متفاوت دارا هستند و سطح زیر منحنی ROC در مدل رگرسیون لجستیک بیشتر از مدل درخت تصمیم است و از عملکرد بهتری برخوردار است.
استفاده از الگوریتم های دسته بندی و خوشه بندی برای پیش بینی تعداد قرص مصرفی: مورد کاوی بیماری دیابت(مقاله پژوهشی وزارت بهداشت)
حوزه های تخصصی:
مقدمه: امروزه با شیوع بیماری دیابت پیش بینی تعداد قرص مصرفی Glibenclamid و Metformin روزانه برای بیماران به پزشکان در جهت تشخیص تعداد قرص مصرفی بیمار و همچنین مهار عوارض شدید و خطرناک مصرف بیش از حد دارو کمک می نماید، زیرا میزان نیاز بیماران دیابتی به دارو دارای اهمیت بسیار می باشد. از این رو در پژوهش حاضر به منظور پیش بینی تعداد قرص مصرفی روزانه ی بیماران دیابتی، از تکنیک های داده کاوی استفاده شد. در پایان الگوریتمی که نتیجه ی بهتری در فرآیند ارزیابی بدست می دهد، با توجه به مجموعه داده های تحت بررسی، انتخاب می شود.
روش بررسی: مطالعه ی حاضر به روش توصیفی- مقطعی صورت گرفت. نمونه گیری به روش سرشماری بود و تمامی بیماران (2783 بیمار) را در فاصله ی زمانی فروردین 87 تا خرداد 91 در برگرفت. جامعه ی پژوهش متشکل از داده های مرکز تحقیقات دیابت یزد وابسته به دانشگاه علوم پزشکی شهید صدوقی یزد بود و محتوای رکوردها مورد تایید مسؤولین مرکز دیابت قرار گرفت. در مرحله ی پیش پردازش داده ها، با نظر افراد خبره در مراکز تحقیقاتی رکوردهایی که مقادیر برخی فیلدهای آنها خالی بود، حذف شد و تعداد بیماران تحت بررسی به 740 مورد رسید. این یافته ها با مراجعه ی مستقیم پژوهشگر به مرکز تحقیقات دیابت یزد حاصل شده و روایی روش جمع آوری اطلاعات توسط استاد راهنما و متخصصین امر مورد تایید قرار گرفت. با سنجش صحت مجموعه داده های آزمون، میزان پایایی دو الگوریتم مورد استفاده نیز مقایسه شد. در این مطالعه جهت تحلیل داده ها و اجرای الگوریتم های داده کاوی از نرم افزار Clementine 12.0 استفاده شد. دو الگوریتم متفاوت از الگوریتم های استنتاج قانون به نام های C5.0 و CHAID روی داده ها اعمال گردید و سپس صحت مدل های تولید شده بدست آمد. در نهایت برای تایید صحت مدل های تولید شده از خوشه بندی استفاده گردید.
یافته ها: مقادیر به دست آمده برای صحت مدل های ایجاد شده از اجرای الگوریتم های C5.0 و CHAID روی مجموعه داده های تحت بررسی 52/45 و 38/28 درصد بود. صحت بالای مدل C5.0 عملکرد بهتر این الگوریتم برای پیش بینی تعداد قرص مصرفی را نشان داد. از طرفی پایین بودن مقدار صحت این مدل نشان دهنده ی این بود که برخی مقادیر به طور صحیح در جای خود دسته بندی نشده اند. بنابراین مقایسه ی مقادیر واقعی و مقادیر پیش بینی شده برای تعداد قرص مصرفی در تولید مدل می تواند بیانگر علل کاهش صحت هر مدل باشد. علت کاهش صحت مدل به مقادیر پیش بینی شده ای وابسته بود که در مقایسه با مقادیر واقعی صحت و ضریب اطمینان پایینی دارند. خوشه بندی نتایج بدست آمده از اجرای الگوریتم C5.0 تعداد قرص مصرفی 3، 5، 6 و 7 با صحت مقدار پیش بینی شده ی به ترتیب 83/46، 36/36، 71/55 و 15 درصد را در یک خوشه قرار داد، زیرا نمونه داده هایی که دارای صحت پایینی در پیش بینی تعداد قرص مصرفی بود و یا تعداد نمونه داده ی کمی داشت، در یک خوشه قرار گرفتند. همچنین خوشه بندی نتایج اجرای الگوریتم CHAID نیز تعداد قرص مصرفی 5 با صحت مقدار پیش بینی شده ی 93/20 را در یک خوشه قرار داد.
نتیجه گیری: این مقاله حاصل پروژه ی تحقیقاتی گروه داده کاوی دانشگاه خواجه نصیر بود که در نهایت در قالب فعالیت گروهی تکمیل و به صورت پژوهش حاضر درآمد. در مراکز تحقیقات دیابت وجود رویکرد سازمان دهی شده جهت پیش بینی تعداد قرص مصرفی بیمار به منظور کمک به پزشک برای افزایش صحت تشخیص و جلوگیری ازعوارض جانبی ناشی از تشخیص نادرست در تعداد قرص خوراکی ضروری است. با توجه به لزوم استفاده از فن آوری های رایانه ای، اینترنت و نرم افزارهای تحلیلی و به منظور مهار اثرات خطرناک بیماری، بهتر است اقدامات لازم جهت ابداع رویکردهای پیشنهادی با مشاوره ی متخصصان مربوط انجام شود.
ارزیابی کارایی مدل درخت تصمیم در پیش بینی بارش ایستگاه سینوپتیک کرمانشاه(مقاله علمی وزارت علوم)
حوزه های تخصصی:
بارش یکی از اجزای اصلی بیلان منابع آب بوده و پیش بینی آن می تواند در مدیریت تامین آب کشاورزی مدیریت منابع آب موجود در مخازن سدها و ... مفید باشد. درخت تصمیم به عنوان یکی از مدل های پیش بینی، کارایی زیادی در این زمینه دارد و به تولید قانون می-انجامد. در این پژوهش جهت رسیدن به اهداف از ارزیابی کارایی مدل درخت تصمیم جهت پیش بینی بارش در ایستگاه سینوپتیک کرمانشاه و از الگوریتم CART (Classification And Regression Tree) به عنوان یکی از انواع درختان تصمیم رگرسیونی جهت پیش بینی بارش 30 ماه بعد استفاده شده است. داده های مورد استفاده این پژوهش مربوط به آمار ماهیانه بارندگی، تبخیر، رطوبت نسبی، دمای ماکزیمم، دمای متوسط و سرعت باد در دوره آماری(1389- 1349) می باشد. سپس جهت ارزیابی درخت های ایجاد شده در این پژوهش از معیارهای آماری مختلف استفاده شده است که در نهایت نتایج نشان می دهد در ایستگاه سینوپتیک کرمانشاه درخت تصمیم گیری رگرسیونی، مدلی نسبتاً کارا در پیش بینی بارش می باشد که استفاده از میانگین متحرّک نسبت به سایر حالات منجر به افزایش چشمگیر کارایی مدل درخت تصمیم می شود و در صورت تعدیل دامنه تغییرات داده های ورودی قادر است با ضریب اطمینان بالایی میزان بارش را 30 ماه قبل از وقوع برآورد نماید که در شبیه سازی های صورت گرفته، زمانی که از میانگین متحرّک پنج ساله داده ها برای اجرای مدل استفاده گردیده، ترکیب بارش قبلی، دمای ماکزیمم به عنوان مناسب ترین حالت شناسایی شده است.
ارزیابی فرآیند ساخت هواپیمای کوچک با رویکرد اختیارات حقیقی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
در بین صنایع گوناگون یکی از زمینه های بسیار حساس برای سرمایه گذاری صنعت هواپیماسازی است، چرا که نیاز به سرما یه های کلان دارد و با ریسک ها و عدم اطمینان های بسیار زیادی روبروست. اما با توجه به اینکه در روش های سنتی تأثیر ریسک و عدم اطمینان و همچنین ارزش اختیارات پروژه های این صنعت به خوبی در نظر گرفته نمی شود، نیاز است تا از مدل های متکی بر اختیارات و ریسک متناسب با این زمینه سرمایه گذاری استفاده گردد. بنابراین در این مقاله مدلی بر پایه تئوری اختیارات حقیقی ارائه شده است که در هفت گام ابتدا به بررسی و ارزیابی ریسک پرداخته، سپس با استفاده از درخت دودویی توسعه یافته، پروژه را از دو منظر ریسک و هزینه مورد ارزیابی قرار می دهد. عدم قطعیت ها نیز که پیش از این به صورت ترکیبی با ریسک در مدل ها در نظر گرفته می شد به صورت مجزا و با بهره گیری از شبیه سازی مونت کارلو مورد بررسی و تحلیل قرار گرفته است. در حالی که روش های سنتی اجرای پروژه را توصیه نمی کردند اما نتایج مدل پیشنهادی با در نظر گرفتن اختیارات پروژه حاکی از ارزشمند بودن آن می باشد.
بررسی عوامل موثر بر به هنگامی گزارش گری مالی با استفاده از تکنیک های شبکه های عصبی مصنوعی و درخت تصمیم(مقاله علمی وزارت علوم)
حوزه های تخصصی:
به هنگامی از ویژگی های اطلاعات مفید در تصمیم گیری است که توجه روزافزون نهادهای نظارتی را به خود جلب کرده است. این پژوهش به بررسی عوامل مرتبط با به هنگامی گزارش گری مالی سالانه در شرکت های بورس اوراق بهادار تهران می پردازد. اثر نسبت های مالکیت سهامداران عمده، سهامداران نهادی، هیئت مدیره، مدیر عامل و هلدینگ ها، تعداد سهامداران عمده، نسبت اعضای غیرمؤظف، تمایز مدیر عامل و رئیس هیئت مدیره، موسسه حسابرسی، تغییر حسابرس مستقل، اندازه شرکت، قدمت شرکت، بازده ارزش ویژه، خبر خوب، گزارش مالی تلفیقی، وجود سیستم بهای مورد تأیید حسابرس، اظهارنظر مقبول حسابرس مستقل و صنعت در خلال سال های 1387 تا 1389 روی کیفیت به هنگامی گزارشگری مالی سالانه مورد مطالعه قرار گرفته است. جهت آموزش و آزمون مدل از دو تکنیک شبکه های عصبی مصنوعی و درخت تصمیم استفاده شده است. نتایج حاصله نشان می دهد که به ترتیب متغیرهای نسبت مالکیت سهامداران نهادی، تعداد سهامداران عمده، صنعت، حسابرس بزرگ، اظهارنظر مقبول، نسبت اعضای غیرموظف هیئت مدیره، گزارش تلفیقی و بازده ارزش ویژه بیشترین اثر را روی کیفیت به هنگامی دارا می باشند. نتایج بیانگر آن است که میانگین دقت تکنیک شبکه عصبی مصنوعی بالاتر از درخت تصمیم است.
پیش بینی گزارش حسابرس مستقل در ایران : رویکرد داده کاوی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
با افزایش مبادلات تجاری، اقتصادی، پیشرفت تکنولوژی اطلاعات و انباشته شدن داده های مالی، تکنیکهای داده کاوی به منظور استفاده بهینه و کارا از این داده ها رواج یافت. هدف این پژوهش پیش بینی گزارش حسابرس مستقل با استفاده از تکنیک های داده کاوی می باشد. اهمیت پیش بینی گزارش حسابرس مستقل در تاثیر آن بر تصمیم گیری استفاده کنندگان می باشد.گزارش حسابرس مستقل در این تحقیق به دو دسته مقبول و غیرمقبول (شامل گزارشات مشروط، مردود و عدم اظهارنظر) طبقه بندی شده است. به منظور پیش بینی گزارش حسابرس مستقل از دو تکنیک طبقه بندی داده کاوی شامل، درخت تصمیم C5.0 و شبکه های عصبی مصنوعی استفاده شده است. جامعه آماری پژوهش شامل تمامی شرکت های پذیرفته شده در بورس اوراق بهادار تهران طی سال های 1382 الی 1388 می باشد. در این تحقیق از 29 متغیر مالی و غیرمالی در قالب 10 طبقه نقدینگی، عملکرد، اهرم مالی، ساختار سرمایه، سودآوری، ریسک ورشکستگی، مدیریت سود، حاکمیت شرکتی، اندازه شرکت و سایر (شامل نوع صنعت و عمر شرکت) به منظور آموزش و آزمون مدل استفاده شده است. نتایج تحقیق نشان می دهند که میانگین دقت مدل حاصل از تکنیک درخت تصمیم C5.0 (88.64%) از تکنیک دیگر بیشتر می باشد. همچنین با اهمیت ترین متغیرها جهت پیش بینی نوع گزارش حسابرس مستقل شامل، نوع گزارش حسابرسی سال قبل، نسبت سود و زیان خالص به درآمد خالص و نسبت بدهیها به داراییها می باشند.
داده کاوی و تحلیل رفتار شهروندان در تفکیک زباله از مبدأ با بهره گیری از الگوریتم C4.5 درخت تصمیم (مطالعة موردی: شهر مشهد)(مقاله علمی وزارت علوم)
حوزه های تخصصی:
اهداف: هدف این پژوهش، ارایة الگوریتم تصمیم سازی شهروندان در زمینة همکاری با طرح تفکیک زباله از مبدأ و شناسایی مهم ترین متغیرهای مؤثر بر رفتار شهروندان در این زمینه و ایجاد امکان اتخاذ سیاست های هدفمند به منظور ارتقای سطح مشارکت شهروندان با طرح تفکیک زباله از مبدأ و افزایش سطح کارایی هزینه ای سیاست های اتخاذ شده است.
روش: این پژوهش با بهره گیری از دانش نوین داده کاوی و الگوریتم C4.5تکنیک درخت تصمیم و استفاده از داده ها و اطّلاعات 145 شهروند شهر مشهد که در سال 1390 با استفاده از روش نمونه گیری تصادفی ساده جمع آوری شده است، الگوریتم های تصمیم سازی شهروندان را در زمینة همکاری با طرح تفکیک زباله از مبدأ ارایه می کند.
یافته ها/ نتایج: نتایج این مطالعه نشان می دهد که متغیر رضایت از طرح تفکیک زباله از مبدأ، مهم ترین متغیری است که می تواند بر رفتار شهروندان در همکاری با این طرح مؤثر باشد. متغیرهای دیگری نیز در سطوح بعدی بر رفتار شهروندان مؤثرند که از آن جمله می توان به وضعیّت شغلی مادر خانواده، ارزیابی از نحوة ارزش گذاری طرح از زبالة تفکیک شده، آگاهی از مزایای زیست محیطی، اقتصادی و اجتماعی طرح تفکیک زباله از مبدأ و سطح تحصیلات اشاره کرد.
نتیجه گیری: نتایج این مطالعه می تواند به سیاست گذاران این عرصه در اتخاذ سیاست های هدفمند به منظور بهبود وضعیّت توسعة شهری و در نهایت ارتقای سطح رفاه شهروندان که مهم ترین هدف تمامی نهادهای متولی امور شهر است، کمک کند.
بررسی عوامل موثر بر به هنگامی گزارشگری مالی با استفاده از تکنیک های شبکه های عصبی مصنوعی و درخت تصمیم(مقاله علمی وزارت علوم)
حوزه های تخصصی:
به هنگامی از ویژگی های اطلاعات مفید در تصمیم گیری است که توجه روزافزون نهادهای نظارتی را به خود جلب کرده است. این پژوهش به بررسی عوامل مرتبط با به هنگامی گزارش گری مالی سالانه در شرکت های بورس اوراق بهادار تهران می پردازد. اثر نسبت های مالکیت سهامداران عمده، سهامداران نهادی، هیئت مدیره، مدیر عامل و هلدینگ ها، تعداد سهامداران عمده، نسبت اعضای غیرمؤظف، تمایز مدیر عامل و رئیس هیئت مدیره، موسسه حسابرسی، تغییر حسابرس مستقل، اندازه شرکت، قدمت شرکت، بازده ارزش ویژه، خبر خوب، گزارش مالی تلفیقی، وجود سیستم بهای مورد تأیید حسابرس، اظهارنظر مقبول حسابرس مستقل و صنعت در خلال سال های 1387 تا 1389 بر به هنگامی گزارشگری مالی سالانه مورد مطالعه قرار گرفته است. جهت آموزش و آزمون مدل از دو تکنیک شبکه های عصبی مصنوعی و درخت تصمیم استفاده شده است. نتایج حاصله نشان می دهد به ترتیب متغیرهای نسبت مالکیت سهامداران نهادی، تعداد سهامداران عمده، صنعت، حسابرس بزرگ، اظهارنظر مقبول، نسبت اعضای غیرموظف هیئت مدیره، گزارش تلفیقی و بازده ارزش ویژه بیشترین اثر را بر به هنگامی دارند. بعلاوه، میانگین دقت تکنیک شبکه عصبی مصنوعی بالاتر از درخت تصمیم است.
پیش بینی بازده سهام شرکت ها با استفاده از نسبت های مالی تحت رویکرد درخت تصمیم
حوزه های تخصصی:
هدف از پژوهش حاضر این است که با استفاده از نسبت های مالی، به مدلی بر پایه نسبت های مالی برای پیش بینی بازده جاری و آتی شرکت ها دست بیابیم. در این پژوهش به منظور بررسی توانایی نسبت های مالی در تبیین بازده جاری و پیش بینی بازده آتی سهام، از روش درخت تصمیم استفاده شده است. در این روش مجموعه ای از شرط های منطقی به صورت یک الگوریتم با ساختار درختی برای پیش بینی و تبیین یک پیامد به کار می رود. از این رو مدل های حاصل از چهار الگوریتم درخت تصمیم (شامل CHAID، ECHAID، QUEST و CRT) با استفاده از 70 درصد داده های پژوهش شکل گرفته و نتایج حاصل از آزمون آن ها در 30 درصد باقیمانده داده ها به وسیله معیار هایی نظیر صحت، دقت و جداول درهم ریختگی مقایسه شده است. از اطلاعات 317 شرکت پذیرفته شده بورس اوراق بهادار تهران طی سال های 1381 تا 1392 در این پژوهش استفاده شده است. نتایج به دست آمده نشان می دهد که الگوریتم های CRT و ECHAID در تبیین بازده جاری و الگوریتم CHAID در پیش بینی بازده آتی بهترین عملکرد را دارند. همچنین قدرت مدل ها در تبیین بازده جاری بیشتر از پیش بینی بازده آتی است. چون در هر دو حالت توانایی مدل ها از نظر آماری قابل اتکا نبوده، فرضیه برقراری ارتباط تبیینی بین نسبت های مالی طرح شده در این پژوهش و تغییرات بازده جاری و آتی سهام رد می شود.
ارائه یک رویکرد ترکیبی برپایه ی تئوری مجموعه ناهموار- درخت تصمیم در پایش تغییرات کاربری اراضی با استفاده از تصاویر سنجنده ی TM (مطالعه موردی: شهرستان شوشتر)(مقاله علمی وزارت علوم)
حوزه های تخصصی:
با پیشرفت علم و تکنولوژی، حجم زیادی از داده های فضایی و غیرفضایی در پایگاه داده های بزرگ ذخیره می شوند. تحلیل این داده ها به منظور تصمیم گیری نیاز به داده کاوی فضایی را بطور جدی برای کشف دانش ضروری می سازد. بکارگیری تصاویر ماهواره ای، تحلیل زمین آماری و انواع داده های فضایی در مطالعات پایش تغییرات کاربری اراضی ابزاری مفید و کاربردی هستند؛ اماآنچه در این میان مهم است استخراج قواعد دقیق بواسطه ادغام مقادیر داده های زیاد به منظور فراهم ساختن دانش درباره قلمرو مورد بحث است. تئوری مجموعه ناهموار (RST) یکی از تکنیک های داده کاوی است که بطرق گوناگون در مدلسازی عدم قطعیت در داده ها استفاده می گردد. از اینرو در این پژوهش، روش کشف دانش RST بمنظور استخراج قواعد در ترکیب با الگوریتم درخت تصمیم (DT) برای طبقه بندی تصاویر ماهواره ای و پایش تغییرات کاربری اراضی مورد استفاده قرار می گیرد. نتایج تحقیق حاکی از آن است که با توجه به تغییرات بوقوع پیوسته طی سه دوره زمانی 6891 (5631)، 8991 (7731) و 4102 (3931) می توان دریافت که تغییرات افزایشی و کاهشی چشمگیری بترتیب در اراضی ساخت شده و پهنه های آبی اتفاق افتاده است؛ در حالیکه اراضی کشاورزی تغییرات چندانی نداشته است. البته با توجه به سال پایه (6891) می توان بیان داشت که سطح زیرکشت اراضی کشاورزی منطقه نسبت به سال پایه که همزمان با جنگ تحمیلی بوده است تغییرات اندکی را شاهد بوده و این یعنی که طی سه دهه گذشته سطح زیرکشت به مانند دوره جنگ تحمیلی است. این امر بیانگر بحرانی است که در بخش کشاورزی در حال اتفاق افتادن است. همچنین نتایج به لحاظ متدولوژی با توجه به صحت کلی و آماره کاپا حاصل از مدل ترکیبی DT-RST می توان گفت که RST ابزاری قدرتمند در داده کاوی، تقلیل داده های زائد از پایگاه داده ها و استخراج قواعد برای بکارگیری در روش DTمی باشد.