مطالب مرتبط با کلیدواژه

یادگیری ماشین


۴۱.

توسعه و تبیین نظام اعتبارسنجی مشتریان بانک ها بر اساس مدل های هیبریدی فرایادگیر: مطالعه موردی بانک ملت(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ریسک اعتباری یادگیری ماشین مشتری خوب مشتری بد

حوزه های تخصصی:
تعداد بازدید : ۱۶۳ تعداد دانلود : ۱۰۲
امکان استمهال و تجدید قراردادهای تسهیلات در ایران ممکن است منجر به شناسایی سود موهومی توسط بانک ها شده و در نهایت بحران بانکی و اخلال در نظام پولی کشور را در پی داشته باشد، لذا برای جلوگیری از رسیدن بانک ها به مرحله استمهال و تجدید قراردادها، سنجش ریسک اعتباری مشتریان بسیار ضروری است. هدف پژوهش حاضر افزایش دقت و صحت اعتبارسنجی مشتریان، با استفاده از ساختار مدل های هیبریدی بوده و به صورت مطالعه موردی بر روی بانک ملت انجام شده است. در این راستا 14 مدل یادگیرنده با یکدیگر مقایسه و میزان توانایی آن ها در اعتبار سنجی مشتریان مشخص شد. نتایج حاکی از آن است که بر اساس هر دو معیار صحت (نرخ موفقیت) و سنجه F (میانگین هارمونیک بین دقت و یادآوری) مدل ترکیبی فرایادگیر (KNN-NN-SVMPSO)-(DL)-(DBSCAN) با نرخ صحت 99.90  از بالاترین عملکرد نسبت به سایر مدل های پایه و ترکیبی فرایادگیر برخوردار است. همچنین با استفاده از روش های تجزیه و تحلیل اصل جزء (PCA)، شاخص جینی (Gini)، نسبت اطلاعات بهره (IGR) و اطلاعات بهره (IG) نسبت به محاسبه وزن ویژگی ها و رتبه میانگین آن ها نشان داده شد، که ویژگی هایی همچون میزان وثیقه، نوع وثیقه و میزان تسهیلات به ترتیب مهم ترین ویژگی ها در تشخیص مشتریان خوب(دارای ریسک اعتباری کم) از بد (دارای ریسک اعتباری بالا) بوده اند.
۴۲.

توسعه الگوریتم های یادگیری ماشین جهت پیش بینی شاخص کیفیت هوای شهری (منطقه مطالعاتی: شهر تهران)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: آلودگی هوا یادگیری ماشین جنگل تصادفی ماشین بردار پشتیبان الگوریتم ژنتیک

حوزه های تخصصی:
تعداد بازدید : ۲۰۵ تعداد دانلود : ۱۲۷
با توجه به مضرات آلودگی هوا بر سلامت انسان ها و محیط، کاهش و حل این معضل براساس شناخت دقیق آلاینده ها و عوامل تأثیرگذار بر آن و مشخص نمودن پهنه های آلوده ضروری به نظر می رسد؛ بنابراین استفاده از مدل های ریاضی در قالب یادگیری ماشینی رویکردی بهینه و مقرون به صرفه برای مدل سازی آلودگی هواست. این تحقیق به لحاظ هدف کاربردی بوده و روش بررسی آن توصیفی-تحلیلی است. نوآوری تحقیق حاضر ارائه یک رویکرد ترکیبی جدید جهت تعیین معیارهای مؤثر در پیش بینی میزان آلودگی هوا می باشد. لذا هدف از تحقیق حاضر ارزیابی و مقایسه قابلیت دو مدل یادگیری ماشین، یعنی ماشین بردار پشتیبان ( SVM) و جنگل تصادفی ( RF) در ترکیب با الگوریتم ژنتیک (GA) جهت پیش بینی میزان آلودگی هوا در شهرستان تهران است. داده های مورداستفاده در این تحقیق شامل ذرات معلق و آلاینده های گازی شهر تهران مرتبط با سال 1399 می باشد که از شرکت کنترل ترافیک شهر تهران اخذ گردیده است. به منظور تجزیه وتحلیل داده ها از نرم افزارهای Matlab و ArcMap استفاده شد. مقدار ضریب تشخیص (R2)  حاصل از روش ترکیبی RF-GA برابر 997/0 به دست آمد که نشان دهنده سازگاری بالای این مدل با داده های این تحقیق است. همچنین مقدار ریشه میانگین خطای مربعات (RMSE) برابر 153/0 به دست آمد که نشان دهنده دقت بالای این مدل می باشد. بر اساس اطلاعات گرفته شده از شرکت کنترل ترافیک شهر تهران، نتایج حاصل از روش RF بیانگر مناسب بودن انتخاب مدل مذکور جهت برآورد میزان آلودگی هوای شهر تهران بوده است.
۴۳.

مقایسه دقت مدل های آماری و یادگیری ماشین برای پیش بینی نگهداشت وجه نقد و ارائه مدل بهینه(مقاله علمی وزارت علوم)

کلیدواژه‌ها: رگرسیون لاسو پیش بینی نگهداشت وجه نقد یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۱۲۱ تعداد دانلود : ۱۳۱
پژوهش حاضر، مقایسه دقت مدل های یادگیری ماشین و آماری در پیش بینی نگهداشت وجه نقد را با استفاده از مجموعه متغیر های مالی و اقتصادی مورد بررسی قرار داده است. روش شناسی پژوهش را می توان به سه مرحله گزینش مجموعه داده و متغیرها، مدل سازی و قیاس تقسیم بندی کرد. نمونه آماری پژوهش حاضر بورس اوراق بهادار تهران است که داده های 173 شرکت در طی بازه زمانی 1400-1389 مورد بررسی قرارگرفته است. نتایج حاکی از دقت بالای مدل رگرسیون نمادین با استفاده از الگوریتم ژنتیک با ضریب دقت 71 درصد در این زمینه است. بعدازآن به ترتیب مدل های تقویت گرادیان درختی، رگرسیون مارس، شبکه عصبی و تقویت گرادیان فوق العاده به عنوان دقیق ترین مدل ها جهت پیش بینی ارزیابی شدند. درنهایت مدل K نزدیک ترین همسایه ضعیف ترین دقت پیش بینی را از خود نشان داد. همچنین اگرچه مدل های آماری دقت پیش بینی پایینی را نشان دادند اما بااین حال از برخی مدل های یادگیری ماشین ضریب دقت بالاتری را کسب کردند. همچنین نتایج نشان داد استفاده از رگرسیون لاسو موجب بهبود دقت مدل های آماری و برخی از مدل های یادگیری ماشین می گردد. این پژوهش می تواند زوایای جدیدی از تکنیک های پیش بینی نگهداشت وجه نقد را در مطالعات مالی بیفزاید؛که تاکنون در ادبیات مالی مورد بررسی قرار نگرفته است.
۴۴.

مقایسه دقت مدل های منتخب یادگیری ماشین جهت پیش بینی قیمت سهام در بورس اوراق بهادار(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بورس اوراق بهادار پیش بینی قیمت سهام الگوریتم یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۳۳۹ تعداد دانلود : ۲۰۲
رشد بازار سرمایه با سرعت چشمگیری در حال افزایش است. همین امر باعث تقاضای بالاتر برای اطلاعات، تلاش بیشتر برای پیش بینی و ابداع مدل های جدید پیش بینی آینده بازار شده است. مدلهای پیش بینی در سه دسته قابل طبقه بندی هستند. دسته اول از تحلیل تکنیکی، دسته دوم از تحلیل بنیادین و دسته سوم از داده کاوی و یادگیری ماشین استفاده می کنند. در پژوهش پیش رو با تمرکز بر روش داده کاوی به مقایسه دقت مدل های منتخب یادگیری ماشین شامل شبکه عصبی، رگرسیون لجستیک، نزدیک ترین همسایه k، ماشین بردار پشیبان و اعتبارسنجی ضربدری جهت پیش بینی قیمت سهام برای 12 شرکت منتخب بورس اوراق بهادار تهران که از طریق روش حذف سیستماتیک انتخاب شده اند در قالب مدلهای یادگیری ماشین پرداخته و نتایج این مقاله نشان داد از بین الگوریتمهای یادگیری ماشین، الگوریتم ماشین بردار پشتیبان بیشترین قدرت پیش بینی کنندگی در قیمت سهام را به خود اختصاص داده است. کلمات کلیدی: بورس اوراق بهادار، پیش بینی؛ قیمت سهام، الگوریتم، یادگیری ماشینکد طبقه بندی JEL: C8،G1
۴۵.

تحلیل روی گردانی مشتریان مبتنی بر رویکرد داده کاوی: الگوریتم ترکیبی درخت تصمیم و شبکه بیزین (مورد مطالعه: فروشگاه های زنجیره ای)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: روی گردانی مشتری داده کاوی الگوریتم درخت تصمیمC5.0 الگوریتم شبکه بیزین یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۹۲ تعداد دانلود : ۹۳
امروزه سازمان ها به این آگاهی رسیده اند که حفظ مشتریان باعث سودآوری بیشتر می شود. همچنین، افزایش رقابت نیز باعث می شود تا میزان روی گردانی مشتریان افزایش یابد؛ از این رو مطالعه عوامل مؤثر بر تمایل به روی گردانی یا عدم رو ی گردانی مشتریان برای پژوهشگران و فعّالان کسب وکار ها اهمیت دارد. در پژوهش حاضر یک مدل ترکیبی مبتنی بر رویکرد داده کاوی برای تحلیل عوامل رو ی گردانی مشتریان ارائه شده است. در گام نخست برای شناسایی عوامل با درجه اهمیت زیادتر و حذف موارد زائد از گره انتخاب ویژگی استفاده و در گام دوم نیز برای طبقه بندی و پیش بینی مشتریان به دو دسته مشتریان روی گردان و مشتریان غیر روی گردان از درخت تصمیم C5.0 و شبکه بیزین استفاده شده است. درنهایت، مدل پیشنهادی در صنعت فروشگاه های زنجیره ای به عنوان مطالعه موردی پیاده سازی شده است. یافته های پژوهش حاکی از آن است که هر دو مدل درخت تصمیم و شبکه بیزین توانایی مناسب را برای پیش بینی روی گردانی مشتریان دارد و سطح زیر منحنی عملیاتی گیرنده در مدل درخت تصمیم بیشتر از مدل شبکه بیزین بوده است؛ درنتیجه مدل درخت تصمیم عملکرد بهتری دارد. همچنین، نتایج نشان می دهد که سه عامل جنسیت، وضعیت تأهل و سن از مجموعه مشخصه های دموگرافیک و پنج عامل متوسط سطح درآمد ماهیانه، تعداد خرید در ماه، سهم خرید اینترنتی، نحوه آشنایی با فروشگاه و نوع بازار مربوط به سوابق تراکنش های مشتریان از مهم ترین عوامل مؤثر بر روی گردانی مشتریان است.
۴۶.

شناسایی عوامل تاثیرگذار در رویگردانی مشتریان شرکت مخابرات کردستان و ارائه مدل هایی برای پیش بینی رویگردانی با استفاده از الگوریتم های یادگیری ماشین(مقاله پژوهشی دانشگاه آزاد)

کلیدواژه‌ها: پیش بینی رویگردانی مشتریان داده کاوی یادگیری ماشین شبکه های عصبی مصنوعی

حوزه های تخصصی:
تعداد بازدید : ۵۹ تعداد دانلود : ۵۷
مشتریان منبع اصلی درآمد و دارایی مهم برای هر سازمان هستند. با این دیدگاه، امروزه شرکت ها تلاش بیشتری را برای حفظ مشتریان موجود آغاز کرده اند. از آنجا که در بسیاری از شرکت ها هزینه به دست آوردن مشتری جدید بسیار بالاتر از هزینه ایجاد رضایتمندی مشتری فعلی است، رویگردانی مشتری به حوزه اصلی نگرانی این شرکت ها تبدیل شده است. لذا شرکت های مبتنی بر مشتری از جمله شرکت های فعال در صنعت مخابرات به دلیل رویگردانی مشتریان با چالش بزرگی روبرو هستند. با توسعه سریع صنعت مخابرات، پیش بینی رویگردانی به عنوان یکی از فعالیتهای اصلی در به دست آوردن مزیت رقابتی در بازار محسوب می شود. پیش بینی رویگردانی مشتری به اپراتورها اجازه می دهد تا قبل از مهاجرت مشتریان فعلی به اپراتورهای دیگر، یک دوره زمانی برای اصلاح و اجرای یک سری اقدامات پیشگیرانه داشته باشند. در این پژوهش یک سیستم پشتیبانی تصمیم برای پیش بینی و تخمین رویگردانی مشتریان شرکت مخابرات استان کردستان (دارای 529000 مشترک) با روش های مختلف داده کاوی و یادگیری ماشین (شامل رگرسیون خطی چندگانه (MLR)، رگرسیون چند جمله-ای(PR)، رگرسیون لجستیک، شبکه های عصبی مصنوعی، آدابوست و جنگل تصادفی) ارایه شده است. نتایج ارزیابی های انجام شده بر روی مجموعه داده های شرکت مخابرات استان کردستان عملکرد بالای روش های شبکه های عصبی مصنوعی با دقت 99.9% ، آدابووست با دقت 100% و جنگل تصادفی با دقت 100% را نشان می دهد.
۴۷.

طبقه بندی و تخصیص تأمین کنندگان به مشتری در زنجیره تأمین تاب آور با استفاده از یادگیری ماشین(مقاله علمی وزارت علوم)

کلیدواژه‌ها: تاب آوری زنجیره تأمین انتخاب تأمین کننده تاب آور یادگیری ماشین تخصیص تأمین کننده به مشتری زنجیره تامین خودرو

حوزه های تخصصی:
تعداد بازدید : ۱۰۶ تعداد دانلود : ۹۲
انتخاب و تخصیص در زنجیره  تأمین تاب آور، زمانی که اختلال زنجیره تأمین را تهدید می کند، به عنوان یک تصمیم استراتژیک و به کانون پژوهش های بسیاری تبدیل شده است؛ از سوی دیگر افزایش کاربردهای یادگیری ماشین در سراسر مطالعات زنجیره تأمین به ظهور روش های تصمیم گیری سریع تر و مطمئن تر منجر شده است، بااین حال در مطالعات کمی از یادگیری ماشین برای مقابله با مشکل انتخاب و تخصیص تأمین کننده به مشتری در حالت تاب آور استفاده شده است. هدف پژوهش حاضر برداشتن گامی در جهت رفع این شکاف با استفاده از الگوریتم های یادگیری ماشین بر روی داده های دنیای واقعی از زنجیره تأمین خودرو در ایران است. بدین منظور از داده های عملکردی441 تأمین کننده و 7 مشتری در سال 1401 استفاده شد. در این پژوهش از دو الگوریتم خوشه بندی برای تولید برچسب بر اساس مفهوم ظرفیت تاب آوری استفاده شده است؛ سپس ازآنجاکه تفسیرپذیری نتایج در اولویت قرار داشت، بر اساس لیبل گذاری خوشه ها توسط خبرگان از درخت تصمیم برای طبقه بندی تأمین کنندگان بر اساس عملکرد آن ها استفاده شد. نتایج نشان داد که درختK-means عملکرد بهتری نسبت به درخت DBSCAN دارد و معیارهای چون تحویل به موقع، درصد تأمین، توقف خط تولید، اخطارهای کیفی، عملکرد لجستیکی و عملکرد کیفی بر تاب آوری تأمین کنندگان مؤثر هستند.
۴۸.

هوش مصنوعی، یادگیری ماشینی و یادگیری عمیق در با نک ها و موسسات مالی

نویسنده:

کلیدواژه‌ها: یادگیری عمیق یادگیری ماشین هوش مصنوعی

حوزه های تخصصی:
تعداد بازدید : ۱۰۸
هوش مصنوعی (AI)، یادگیری ماشین (ML)، و یادگیری عمیق (DL) تأثیر به سزایی روی بانکداری (فناوری مالی یا فین تک)، سلامت و بهداشت (فناوری سلامت)، قانون (فناوری مقررات گذاری)، و سایر بخش هایی مثل جمع آوری کمک های مالی برای خیریه (فناوری خیریه) دارند. سرعت نوآوری مرتبط با فناوری و توانایی سیستم های هوش مصنوعی برای فکر کردن درست شبیه به انسان ها (شبیه سازی هوش انسان)، انجام وظایف و کارها به صورت مستقل، توسعه و بسط هوش براساس تجارب خود، و پردازش لایه های اطلاعاتی برای یادگیری بازنمایی های همواره پیچیده از داده ها (ML/DL) به این معناست که ارتقا و پیشرفت در نرخ هایی که در آن ها این فناوری می تواند وظایف پیچیده، فنی، و زمان بر را انجام دهد، مردم، اشیاء، صداها، الگوها و غیره را شناسایی کند، مشکلات را زودتر بررسی کند، و راه حل ها را ارائه نماید، سودهای خیره کننده ای را در شرایط اقتصادی، سیاسی، و اجتماعی فراهم نماید. هدف از انجام این مقاله بررسی دقیق اختراعات و پیدایش های جدید در هوش مصنوعی، یادگیری ماشین، و یادگیری عمیق در بستر چالش تطبیق مقرراتی است که مؤسسات مالی در بریتانیا (UK) با آن مواجه می شوند.
۴۹.

کلان داده ها و گذار پارادایمی در منظوم دیجیتالیزه شد دیپلماسی

کلیدواژه‌ها: گذار پارادایمی بیگ دیتا دیپلماسی همکاری های بین المللی یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۱۰۰ تعداد دانلود : ۹۷
رشد فناوری در زمینه هوش مصنوعی، موجب تلاش هایی برای گذار پارادایمی در عرصه دیپلماسی شده است. بهره گیری از ظرفیت های کلان داده ها با هدف تأمین اهداف و منافع ملی و دست یازیدن به سطحی از مناسبات جهانی، پدیده ای است که با نام «دیپلماسی بیگ دیتا» مورد استفاده دولت ها قرار می گیرد. دیپلماسی کلان داده به دستگاه دیپلماسی دولت ها امکان می دهد تا در مراودات دوجانبه و یا چندجانبه خود در سازمان های بین المللی که ماهیتاً سازمان هایی برای شکل دهی به همکاری بین المللی اند، به پی جویی منافع و مطالبات خود و تعامل با نظام بین الملل مبادرت نمایند. سؤال پژوهش حاضر این است که شاخصه های دیپلماسی کلان داده در گذار پارادایمی مطالعات این حیطه چیست و نحوه تعامل بر اساس مولفه های مذکور در نظم جهانی چگونه صورت می گیرد؟ مقاله حاضر به روش تحلیلی-توصیفی و از طریق تحلیل محتوای کیفی منظومه دیجیتالیزه دیپلماسی فرضیه پژوهش را این گونه مطرح می کند که شاخصه های دیپلماسی بیگ دیتا در ابعاد هم پیشگی های علمی بین المللی، تحقیقات مشترک علمی، شبکه سازی نخبگان و دانشمندان در سطوح منطقه ای و جهانی به منصه ظهور رسیده است.
۵۰.

تاکسونومی شناسایی مشتریان صنعت بانکی با بکارگیری یادگیری ماشین: مروری نظامند با رویکرد فرا ترکیب(مقاله علمی وزارت علوم)

کلیدواژه‌ها: شناخت مشتری فاکتورهای شناسایی مشتری یادگیری ماشین فراترکیب صنعت بانکی

حوزه های تخصصی:
تعداد بازدید : ۱۱۲ تعداد دانلود : ۱۰۶
هدف: امروزه مشتری در هیچ صنعتی صرفاً به دنبال محصول نیست و دریافت سرویس شخصی سازی شده مبتنی بر نیازمندی های خود و خلق یک تجربه متفاوت را از سازمان انتظار دارد؛ از نگاه دیگر طراحی سرویس های متناسب با نیاز مشتری مستلزم بررسی موشکافانه داده های مرتبط با مشتری و در ابعاد مختلف خواهد بود. لذا شناخت مشتری نیازمند نگرشی نظامند است تا اهداف، فاکتورهای تاثیر گذار و الگوریتم ها و متد های مناسب این حوزه مورد توجه واقع شود. روش شناسی: در راستا هدف این پژوهش، پژوهش پیشرو با رویکرد فراترکیب، ابعاد حوزه شناخت مشتری صنعت بانکی و ملاحظات آن را با رویکرد داده محور و به کارگیری یادگیری ماشین تحلیل نموده است .از این رو، روش پژوهش بر حسب هدف کاربردی و بر حسب گردآوری اطلاعات فراترکب است. برای انتخاب مقاله ها با جست و جو در پایگاه داده های معتبر وب آو ساینس و اسکوپوس 43 سند که در فاصله زمانی 2016- 2022 منتشر شده است، به عنوان اسناد مرتبط و معتبر شناسایی و در ادامه نیز با رویکرد فراترکیب، اسناد منتخب بررسی و کدگذاری شده اند. نتایج : نتایج حاصل از فراترکیب منجر به شناسایی سه مقوله اصلی: اهداف شناسایی مشتری: درک بینش نسبت به مشتری، شناسایی ریسک مشتری، اهداف سازمانی، تعیین ارزش طول عمر مشتری و مدیریت محصول،  فاکتورهای شناسایی مشتری: جمعیت شناختی، مالی و رفتاری  و الگوریتم های یادگیری ماشین: Probabilistic، Neural Networks ،Ensemble ، Regularization ، Regression ، Bayesian، Decision Tree ، Dimensionality Reduction ، Instanced Based  و Clustering گردید.  نتیجه گیری: بر اساس یافته های پژوهش جاری، متناسب با هدف شناسایی مشتری، داده های موجود و فاکتورهای انتخابی، الگوریتم های پایه و ترکیبی می تواند راهگشا باشد اما نکته مهم پیش پردازش دقیق داده ها می باشد. همچنین این مهم با توجه به عدم تاکید بانک ها به شعب مبنی بر لزوم تکمیل اطلاعات مندرج در فرم ها توسط مشتری در زمان افتتاح حساب یا عدم طراحی سرویس مناسب جهت تکمیل اطلاعات در بسترهای الکترونیک نیازمند بازبینی کامل می باشد. 
۵۱.

ارائه مدل پیش بینی کننده آسیب پذیری کالبدی محلات در برابر زلزله با استفاده از یادگیری ماشین (مطالعه ی موردی: منطقه 1 شهرداری تهران)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: مدل پیش بینی کننده آسیب پذیری یادگیری ماشین مورفولوژی زلزله

حوزه های تخصصی:
تعداد بازدید : ۸۵ تعداد دانلود : ۷۴
مدیریت بحران هوشمند (در سه مرحله قبل، حین و پس ازآن)، با تأکید بر آمادگی و پیش بینی آسیب پذیری در برابر زلزله، امکان پیش بینی، کاهش آسیب پذیری و افزایش قدرت در تصمیم-سازی را فراهم می آورد. این مقاله بر آن است تا با استفاده از یادگیری ماشین، به ارائه مدل پیش-بینی کننده آسیب پذیری کالبدی در برابر زلزله بپردازد. روش پژوهش کمی است. داده های ارائه شده به ماشین برای آموزش و تست، مربوط به پهنه های محلات منطقه 1 شهرداری تهران بوده اند (که در محدوده خطر گسل شمال تهران قرار دارند). ویژگی های مورد تأکید که ماشین براساس آنها آموزش دیده تا مدل پیش بینی کننده را ارائه دهد، مشتمل بر موارد زیر هستند: ویژگی های الگوی قطعات و ساختار ابنیه، الگوی معبر، کاربری اراضی و موقعیت نسبت به گسل اصلی و فرعی بوده اند. مجموعه داده ها مشتمل بر 1997 سطر و 26 ستون بوده است. برخی از داده ها از جی.آی.اس. منطقه استخراج و بخش دیگری از داده ها از تحلیل نقشه پهنه ها به دست آمد. با توجه به بهره گیری از رویکرد یادگیری ماشین نظارت شده، برچسب گذاری توسط محققان در پنج طیف انجام شد. برای آموزش ماشین از الگوریتم درخت تصمیم، ماشین بردار پشتیبان و شبکه عصبی چندلایه استفاده شد. حجم داده های آموزش به تست 70 به 30 در نظر گرفته شد. با بررسی دقت مدل توسط ماتریس درهم آمیختگی، مشخص شد که الگوریتم درخت تصمیم با دقت 99.50، حساسیت 99.42 و خطای 0.5 دارای عملکرد بهتری نسبت به دو الگوریتم دیگر است. شبکه عصبی نیز با دقت 97.85، حساسیت 97.57 و خطای 2.15، دارای عملکرد مناسبی است. بررسی میزان اعتمادپذیری مدل پیش بینی کننده با داده های مربوط به محله جوانمرد قصاب در منطقه 20 نیز نشان داد که ماشین آموزش دیده، با دقت بالای 97 درصد قابلیت پیش بینی پذیری دارد. بدین ترتیب ماشین آموزش دیده با دقت و سرعت بالا می تواند به پیش بینی میزان آسیب پذیری بافت های کالبدی در برابر زلزله بپردازد.
۵۲.

پیش بینی هزینه های بیمه درمانی افراد با استفاده از یادگیری ماشین و روش یادگیری جمعی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: داده کاوی ریسک هزینه بیمه درمان یادگیری جمعی یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۱۰۵ تعداد دانلود : ۸۵
پیشینه و اهداف: صنعت بیمه درمانی در پیش بینی هزینه های بیمه افراد که براساس پارامترهای پیچیده ای مانند سن و ویژگی های فیزیکی است، با چالش مهمی مواجه است. شرکت های بیمه برای مدیریت ریسک و جلوگیری از زیان احتمالی، بیمه گذاران را به دو گروه پرخطر و کم خطر دسته بندی می کنند. بااین حال، برآورد دقیق هزینه ها برای هر فرد می تواند کار سختی باشد. برای مقابله با این چالش، ما رویکردی مبتنی بر علم داده و یادگیری ماشین را پیشنهاد می کنیم که از یادگیری جمعی برای پیش بینی افراد پرخطر و کم خطر استفاده می کند.روش شناسی: روش پیشنهادی شامل مراحل مختلفی از جمله پیش پردازش داده ها، مهندسی ویژگی ها و اعتبارسنجی متقابل برای ارزیابی عملکرد مدل است. در مرحله اول، داده ها را با پاک کردن، مدیریت مقادیر ازدست رفته و رمزگذاری متغیرهای طبقه بندی، پیش پردازش می کنیم. در مرحله دوم، ما ویژگی های جدیدی را با استفاده از روش های مهندسی ویژگی ها مانند مقیاس بندی، نرمال سازی و کاهش ابعاد تولید می کنیم. این روش ها به استخراج اطلاعات معنادار از داده ها و بهبود عملکرد مدل کمک می کند. در مرحله بعد، ما از یادگیری جمعی برای ترکیب روش های رگرسیون متعدد، مانند رگرسیون لجستیک، شبکه های عصبی، ماشین های بردار پشتیبانی، جنگل های تصادفی، LightGBM و XGBoost استفاده می کنیم. هدف از ترکیب این روش ها این است که از نقاط قوت آن ها استفاده کنیم و نقاط ضعف آن ها را به حداقل برسانیم تا به دقت پیش بینی بهتری دست یابیم. در نهایت، عملکرد مدل را با استفاده از روش اعتبارسنجی متقاطع k-fold ارزیابی می کنیم. این روش به اعتبارسنجی دقت مدل و جلوگیری از برازش بیش از حد کمک می کند.یافته ها: رویکرد پیشنهادی ما به AUC برابر با 73/0 دست می یابد که اثربخشی آن را در پیش بینی افراد پرخطر و کم خطر نشان می دهد.نتیجه گیری: با استفاده از علم داده و روش های یادگیری ماشین، شرکت های بیمه می توانند دقت برآورد هزینه خود را بهبود بخشند و ریسک را بهتر مدیریت کنند. این رویکرد می تواند به شرکت های بیمه کمک کند تا پوشش بیمه ای و قیمت گذاری دقیق تری را برای افراد ارائه دهند که به رضایت بیشتر مشتریان و کاهش زیان های مالی منجر می شود.
۵۳.

به کارگیری هوش مصنوعی در پیش بینی تولید ناخالص داخلی و نرخ بیکاری و تأثیر متقابل آن ها بر یک دیگر در اقتصاد ایران(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی تولید ناخالص داخلی بیکاری هوش مصنوعی یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۱۰۶ تعداد دانلود : ۸۲
بیکاری و تولید ناخالص از شاخص های مهم اقتصادی هستند؛ پیش بینی این دو شاخص می تواند در اصلاح ساختار اقتصادی و بهبود اقتصاد  مفید واقع شود. تکنیک ها و ابزارهای هوش مصنوعی می توانند برای پیش بینی شاخص های مهم اقتصادی نقش مهمی ایفا کنند. با توجه به اهمیت این دو شاخص، پژوهش حاضر ابتدا به پیش بینی روند دو شاخص به صورت جداگانه و سپس پیش بینی میزان نرخ رشد تولید ناخالص داخلی براساس نرخ بیکاری با استفاده از تکنیک های هوش مصنوعی می پردازد. برای این منظور در این پژوهش، از داده های فصلی مربوط به تولید ناخالص داخلی و نرخ بیکاری برای سال های 1385-1401 استفاده شده است؛ هم چنین از مدل های یادگیری ماشین مبتنی بر رگرسیون برای پیش بینی بهره گرفته شده است. در این پژوهش، به منظور استنتاج بهتر، نتایج پیش بینی روش های یادگیری ماشین با روش اقتصادسنجی ARIMA نیز مورد مقایسه قرار گرفته است. نتایج حاصل از پیاده سازی نشان می دهد که پیش بینی مدل های مذکور از لحاظ معیارهای ارزیابی مانند جذر میانگین مجذور خطا، میانگین قدرمطلق خطا، میانگین قدرمطلق درصد خطا، دارای دقت مناسبی است و بیانگر این است که تکنیک های هوش مصنوعی هم می توانند دو شاخص اقتصادی مذکور و تأثیر متقابل آن ها بر یک دیگر را پیش بینی کنند. 
۵۴.

بهبود دقت برآورد غلظت ازن در سطح زمین با استفاده از محصولات ماهواره ای و یادگیری ماشین(مقاله علمی وزارت علوم)

کلیدواژه‌ها: غلظت ازن یادگیری ماشین رگرسیون خطی چندمتغیّره شبکه عصبی بازگشتی آلاینده جوّی

حوزه های تخصصی:
تعداد بازدید : ۷۴ تعداد دانلود : ۷۰
ازن نزدیک به سطح زمین یکی از آلاینده های بسیار خطرناک است که تأثیرات زیان بار درخور توجهی در سلامت ساکنان مناطق شهری دارد. هدف از این مطالعه شناسایی عوامل مؤثر در غلظت ازن و مدل سازی تغییرات آن، با استفاده از داده های ماهواره ای و روش های گوناگون یادگیری ماشین در شهر تهران است. بدین منظور داده های غلظت آلاینده ها، داده های هواشناسی و دمای سطح خاک، طی بازه زمانی بین سال های 2015 تا 2021، به کار رفت. پس از محاسبه همبستگی بین غلظت ازن و پارامتر های مستقل، طی پنج حالت متفاوت، با پارامترهای ورودی و روش یادگیری متفاوت و به کارگیری پالایش داده ها، غلظت ازن مدل سازی شد. در حالت اول و دوم، مدل سازی با استفاده از داده های غلظت آلاینده ها و داده های هواشناسی با روش رگرسیون خطی چندمتغیره انجام شد. تنها تفاوت این دو حالت، پالایش داده های ورودی به شیوه WTEST در روش دوم است. در حالت سوم، دمای سطح خاک به داده های ورودی افزوده شد و در حالت چهارم و پنجم، به ترتیب مدل سازی ازن با استفاده از شبکه عصبی چندلایه ای و شبکه عصبی بازگشتی انجام شد. مقایسه این حالت ها نشان داد که مدل سازی های مراحل اول تا پنجم، به ترتیب با ضریب تعیین تعدیل شده 5/0، 64/0، 69/0، 74/0 و 8/0 توانایی بازیابی غلظت ازن را داشته اند. همچنین مشخص شد در بین آلاینده های گوناگون، مونوکسید نیتروژن، دی اکسید نیتروژن، نیتراکس و از میان داده های هواشناسی دما، رطوبت و سرعت باد بیشترین تأثیر را در غلظت ازن دارند. افزودن دمای سطح خاک به داده های ورودی نیز افزایش پنج درصدی دقت را در برآورد غلظت ازن، به همراه داشت.
۵۵.

روش های تحلیل کلان داده ها در حوزه مدیریت منابع انسانی: مدلسازی پیش بینِ ترک خدمت کارکنان

نویسنده:
تعداد بازدید : ۹۶ تعداد دانلود : ۷۶
فرآیندهای منابع انسانی و نقش های متخصصان منابع انسانی – که اکنون به مثابه شرکای استراتژیک سازمان تلقی می شوند- طی زمان تغییرات قابل توجهی داشته است. به همین تناسب، در حوزه آکادمیک نیز برخی رویکردها و روش های نوین پژوهش در قلمرو مدیریت منابع انسانی مطرح شده و خصوصاً با توسعه ابزارهای نوین گردآوری و تحلیل کلان داده ها بیش از پیش مورد توجه قرار گرفته است. یکی از این رویکردهای نوپدیدِ تحلیل کلان داده ها، تحلیلگری منابع انسانی است. این رویکرد و روش های ذیل آن چند مشخصه اصلی دارند: نخست، جایگزینی تصمیم گیری های مبتنی بر شهود و تجربه با تصمیم گیری های مبتنی بر شواهد و داده محور، دوم، استفاده از علم آمار، فن آوری های روزآمد، روش پژوهش و مفاهیم مالی برای تحلیل داده های منابع انسانی و داده های کسب و کار، و سوم، سخن گفتن به زبان کسب و کار که در نتیجه پیوند میان کارکردهای منابع انسانی با نتایج کسب و کار حاصل می شود. هدف این مقاله، نخست، معرفی رویکرد کلی و برخی روش های ذیل تحلیلگری منابع انسانی است. سپس به عنوان مثالی عددی از به کارگیری یادگیری ماشین برای مدلسازی پیش بین با استفاده از کلان داده های منابع انسانی، مطالعه ای موردی مطرح و نتایج آن ارائه شده است. نتایج حاصل از به کارگیری روش های تحلیلگری منابع انسانی که در پیوند با نتایج کسب و کار معنادار می شوند، اتخاذ تصمیم گیری های مبتنی بر شواهد را در سطوح استراتژیک سازمان تسهیل می کنند.
۵۶.

ارائه یک مدل تشخیص دیابت مبتنی بر شبکه های عصبی عمیق بازگشتی و الگوریتم بیش نمونه گیری

کلیدواژه‌ها: تشخیص دیابت شبکه عصبی بازگشتی بیش نمونه گیری داده های پرت یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۹۹ تعداد دانلود : ۶۱
دیابت، به گروهی از اختلالات متابولیکی گفته می شود که نتیجه عدم کنترل قند خون است. تشخیص به موقع و در ادامه کنترل این بیماری به خوبی باعث کاهش اثرات ناشی از آن مثل رتینوپاتی دیابتی، گرفتگی قلبی و عروقی سکته های مغزی و غیره می شود. محققان تا به امروز تلاش های بسیاری در این زمینه کرده اند؛ اما اغلب این مدل ها یا مبتنی بر روش های یادگیری ماشین ساده و یا بر این فرض استوار هستند که داده های دیابت در دسترس متوازن هستند. از اینرو، در این مقاله یک مدل تشخیص بیماری دیابت مبتنی بر شبکه های عصبی بازگشتی عمیق و الگوریتم بیش نمونه گیری SMOTE ارائه شده است. در این مدل چندین مرحله پیش پردازش شامل مقدار دهی به مقادیر از دست رفته، حذف داده های پرت و سپس بیش نمونه گیری انجام شده است. از سه شبکه عصبی عمیق بازگشتی با سه واحد پنهان بازگشتی شامل LSTM, GRU و BiLSTM برای تشخیص استفاده شده است. نتایج مدل ارائه شده بر روی پایگاه داده Pima حاکی از آن است که میانگین صحت در 10 اجرای مختلف در LSTM و GRU و BiLSTM به ترتیب 91.21 % ، 89.61 و 90.99 % است. نتایج مدل بازگشتی ما نشان می دهد، شبکه های عصبی عمیق در مقایسه با روش های یادگیری ماشین عملکرد بسیار موفق تری دارند.
۵۷.

تأثیر حاکمیت شرکتی، کیفیت حسابرسی و حسابداری بخش عمومی بر عملکرد مالی با رویکرد شبکه های عصبی (مورد مطالعه : عراق)

کلیدواژه‌ها: حاکمیت شرکتی عملکرد مالی کیفیت حسابرسی حسابداری بخش عمومی یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۱۵۰ تعداد دانلود : ۱۷۲
هدف از انجام پژوهش حاضر بررسی اثر حاکمیت شرکتی، کیفیت حسابرسی و حسابداری بخش عمومی بر عملکرد مالی شرکت های تولیدی و سازمان های دولتی عراق با استفاده از داده های ماهانه بازه زمانی 2015 الی 2022 با استفاده از تحلیل های الگوهای یادگیری ماشین از جمله درخت تصمیم، تقویت گرادیان، ماشین بردار پشتیبانی (SVM) و شبکه های عصبی مصنوعی  (ANNs)می باشد. نتایج نشان دهنده تأثیر قابل توجه حاکمیت شرکتی، کیفیت حسابرسی و حسابداری بخش عمومی بر عملکرد مالی است. مطالعه حاضر نشان می دهد که شرکت های بزرگ تر و دارای ساختار حاکمیتی قوی تر، نتایج مالی بهتری دارند و تمرکز بر تفکیک نقش های مدیریتی و تقویت ساختارهای مدیریتی مؤثر، به بهبود عملکرد مالی شرکت ها کمک می کند. همچنین، تحلیل شبکه های عصبی حاکی از تأثیر محسوس این عوامل بر شفافیت و مدیریت ریسک است. لذا این پژوهش تأکید مجددی بر اهمیت حاکمیت شرکتی و کیفیت حسابرسی به عنوان شاخص های اصلی در افزایش کارایی عملیاتی و اعتماد سرمایه گذاران است. بنابراین پیشنهاد می شود که مدیران و سیاست گذاران به این عوامل به عنوان مؤلفه های کلیدی برای بهبود عملکرد مالی و استحکام اقتصادی توجه کنند. در نهایت پژوهش حاضر به عنوان یک مبنای محکم برای تضمین سلامت و پایداری مالی شرکت ها در اقتصاد عراق شناخته می شود و می تواند برای طیف وسیعی از ذینفعان مالی و سرمایه گذاران، مفید و راهگشا باشد.
۵۸.

پیش بینی و پایش میزان تُن کیلومتر و بارنامه حمل شده جاده ای کشور به منظور تشخیص رفتار غیر عادی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی کنترل کیفیت آماری بارنامه جاده ای تُن کیلومتر یادگیری ماشین یادگیری عمیق پایش

حوزه های تخصصی:
تعداد بازدید : ۸۷ تعداد دانلود : ۵۷
جابه جایی کالا جزء ضروری و لاینفک فرآیند برنامه ریزی توسعه ملّی است؛ هدف پژوهش حاضر، پیش بینی و پایش میزان تُن کیلومتر و بارنامه حمل شده کشور به منظور تشخیص رفتار غیرعادی است. در این پژوهش برای گردآوری داده ها از مشاهده ماهانه به دست آمده طی 6 سال (1395 تا 1400) که توسط «سازمان راهداری و حمل ونقل جاده ای ایران» به تفکیک هر استان جمع آوری شده، استفاده شده است. در این پژوهش تُن کیلومتر با روش های مختلف تن-کیلومتر و بارنامه پیش بینی شده و نتیجه برای یافتن رفتار غیرعادی پس از افزایش نرخ بهره و مالیات کنترل می شود. برای پیاده سازی مدل، از 72 داده تُن کیلومتر حمل شده و 72 بارنامه صادرشده که از 32 استان طی شش سال حمل ونقل جاده ای جمع آوری شده است، استفاده شد. چهار روش مختلف پیش بینی، یعنی جنگل تصادفی، شبکه عصبی LSTM، ARIMA و ETS به تفصیل بررسی شدند. نتایج تجربی نشان می دهد که جنگل تصادفی از سایر مدل ها بهتر عمل می کند. در این پژوهش از ابزار کنترل کیفیت آماری امتیاز z برای تشخیص داده های پرت و رفتار غیرعادی استفاده شد. نتایج تجربی حاکی از آن است که از 32 استان، 3 استان دارای رفتار غیرعادی هستند که یکی از آن ها به دلیلی غیر از افزایش نرخ بهره و مالیات حمل ونقل جاده ای است.
۵۹.

بهینه سازی سبد سرمایه گذاری به کمک پیش بینی بازده مورد انتظار با استفاده از روش های شبکه عصبی LSTM، جنگل تصادفی و ARIMA(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بهینه سازی پرتفولیو یادگیری ماشین یادگیری عمیق خطای پیش بینی سنجه ریسک مالی

حوزه های تخصصی:
تعداد بازدید : ۶۴ تعداد دانلود : ۶۵
در جهان امروز اهمیت مدل های بهینه سازی سبد سرمایه گذاری به صورت فزاینده ای مورد توجه قرار گرفته است. هرچند پیش بینی بازده مورد انتظار گزینه های سرمایه گذاری و در نظر گرفتن آن ها در تابع هدف بیشینه سازی سود امری رایج است لیکن مهم ترین نوآوری پژوهش جاری کمینه سازی خطای پیش بینی به عنوان تابع هدف است. این نوآوری به سرمایه گذاران توصیه می کند که در تشکیل سبد سرمایه گذاری علاوه بر سود و ریسک، بر معیار مهم قابل پیش بینی بودن گزینه های سرمایه گذاری نیز تاکید گردد. ادغام پیش بینی بازده مدل های سری زمانی سنتی در تشکیل پورتفولیو می تواند عملکرد مدل بهینه سازی سبد اصلی را بهبود بخشد. از آنجایی که مدل های یادگیری ماشین و یادگیری عمیق برتری قابل توجهی نسبت به مدل های سری زمانی نشان داده اند، این مقاله پیش بینی بازده در تشکیل پورتفولیو را با مدل یادگیری ماشین، یعنی جنگل تصادفی و مدل یادگیری عمیق حافظه ی کوتاه مدت طولانی ترکیب می کند. به منظور ارزیابی عملکرد مدل پیشنهادی، داده های تاریخی 5 ساله از سال 1396 تا 1401 از شاخص 5 صنعت بانکی، خودرویی، دارویی، فلزی و نفتی است. نتایج تجربی نشان می دهد که مدل های بهینه سازی میانگین واریانس با پیش بینی بازدهی به وسیله جنگل تصادفی ، بهتر عمل می کنند.
۶۰.

توسعه سیستم پیشنهاددهنده بر مبنای استدلال نمونه محور برای نمایه سازی مستندات علمی فارسی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: سیستم های پیشنهاددهنده استدلال نمونه محور روش بازنمایی کلمه-به-بردار بازیابی اطلاعات یادگیری ماشین نمایه سازی

حوزه های تخصصی:
تعداد بازدید : ۹۲ تعداد دانلود : ۶۷
استخراج کلیدواژه یکی از مهمترین قدم های فرآیند نمایه سازی مستندات است. کلیدواژه ها توصیفگرهای مفهومی هستند که می توانند در جستجو و بازیابی اطلاعات و نیز اشاعه آنها بکارگرفته شوند. در پایگاه های دربردارنده اسناد علمی مانند پایگاه علمی گنج پژوهشگاه علوم و فناوری اطلاعات ایران، کلیدواژه ها نقش مهمتری دارند و تخصیص کلیدواژه های تخصصی چالش برانگیزتر است چرا که این پایگاه ها دربرگیرنده اسناد تخصصی با حوزه های علمی مختلفی هستند. فرآیند نمایه-سازی دستی بسیار زمان بر است و با توجه به افزایش حجم تولید و ثبت مستندات علمی، نیاز است که این فرایند با سرعت بیشتری صورت گیرد. لذا استفاده از روش های ماشینی هوشمند برای پیشنهاد و تخصیص کلیدواژه ضروری است. تحلیل آماری و معنایی اسناد و استفاده از روش های یادگیری ماشین از جمله روش های پرکاربرد در بسیاری از پایگاه های اطلاعات علمی دنیا است. بر همین اساس، در این پژوهش روشی برای پیشنهاد کلیدواژه به مستندات علمی فارسی بر مبنای روش های هوشمند پردازش متن و یادگیری ماشین ارائه شده است. این روش بر مبنای سیستم های پیشنهاددهنده و استدلال نمونه محور است که براساس آن، مجموعه ای از کلیدواژه های مرتبط با یک سند به نمایه ساز پیشنهاد می شود تا او سریعتر بتواند کلیدواژه های مناسب را انتخاب کند. به بیانی دیگر، ابتدا اسناد مشابه با سند جدید براساس روش های TFIDFو روش های بازنمایی کلمه-به-بردار، بازیابی شده و سپس کلیدواژه های کاندید از بین اسناد مشابه براساس یک تابع رتبه بندی انتخاب می شوند. روش پیشنهادی بر مجموعه ای از اسناد پایگاه گنج در سه حوزه فنی و مهندسی، هنر و ادبیات، و علوم انسانی، پیاده سازی و نتایج آن با معیارهایی نظیر دقت، فراخوانی و نظرات متخصصین ارزیابی شده است.