مطالب مرتبط با کلیدواژه

یادگیری ماشین


۲۱.

مرور نظامند ادبیات پژوهش با محوریت فناوری مالی، یادگیری ماشین و مدیریت تجربه مشتری و ارائه چارچوبی برای پژوهش های آتی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: فناوری مالی مرور نظامند تئوری بنیادین یادگیری ماشین تجربه مشتری

حوزه های تخصصی:
تعداد بازدید : ۲۳۳
نوآوری فناورانه حوزه صنعت مالی، زیست بوم فناوری مالی را موجب شد. با ظهور هوش مصنوعی، دنیای فناوری و مالی به هم گره خورد تا پردازش های مالی هوشمندانه تری به مدیران جهت تصمیم گیری های هوشمندانه ارائه می کند. نتایج استفاده از روش های یادگیری ماشین ثابت نبوده و پیش بینی دقیق در مورد نتایج حاصل از تجربه مشتریان برای الگوریتم های یادگیری ماشین چالش برانگیزاست. تلاش های زیادی در خصوص مدیریت تجربه مشتری انجام شده است ولی، چارچوب تلفیقی فناوری مالی در تعامل باهوش مصنوعی و یادگیری ماشین در مفهوم سازی تجربه مشتری که می تواند دانش تجربه مشتری را موجب شود، موضوعی است که کمتر به آن پرداخته شده است. این مقاله، با بررسی 75 مقاله و جمعبندی آن در 41 مقاله پژوهشی، موضوع پژوهش حاضر را موردبررسی قرار داده است. جهت پیش بینی ارائه نظریه ،روش تحقیق، تئوری بنیادین می باشد. هدف این مقاله،پوشش شکاف مطالعاتی ازطریق ارائه یک چارچوب تلفیقی است که مسیر کلی برای انجام و مطالعه پژوهش های حوزه فناوری مالی و هوش مصنوعی، در استخراج و مدیریت دانش تجربه مشتریان را در برمی گیرد. یافته ها نشان می دهند که مطالعات انجام شده در سه محور فوق را می توان به پنج بخش اصلی نوآوری طبقه بندی کرد که شبکه های ایجاد ارزش از تجربه مشتریان را در چارچوب تلفیقی فناوری مالی، یادگیری ماشین و تجربه مشتری ارائه می کند. یافته ها، مسیر خوبی برای پرداختن به برخی محدودیت ها در پژوهش های فناوری های مالی و هوش مصنوعی برای مدیریت دانش تجربه مشتریان از طریق امکان ارائه الگو عملکرد مشتریان را فراهم می کنند.
۲۲.

شناسایی عوامل تاثیر گذار بر خلق محتوای ایجاد شده توسط کاربران رسانه های اجتماعی در بخش کسب و کارهای خدماتی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: رسانه های های اجتماعی محتوای ایجاد شده توسط کاربران داده کاوی یادگیری ماشین بازاریابی شبکه های اجتماعی

حوزه های تخصصی:
تعداد بازدید : ۳۴۴ تعداد دانلود : ۱۲۶
رسانه ها و شبکه های اجتماعی با حضور خود شرایط جدیدی را به خصوص در زمینه کسب و کار رقم زده اند. در این میان، یکی از مهمترین موضوعات در بازاریابی رسانه های اجتماعی، محتوای ایجاد شده توسط کاربران 1 [1] (UGC) در شبکه های اجتماعی است. یکی از سوالاتی که در این زمینه مطرح می شود این است که چه عواملی بر خلق محتوای ایجاد شده توسط مشتریان بر روی شبکه های اجتماعی در کسب و کارها تاثیر گذار است. برای رسیدن به پاسخ این سوال، این پژوهش مورد مطالعاتی کافه و کافی شاپ ها را در بخش کسب و کار های خدماتی مد نظر قرار داده است. در این پژوهش ۵۰ کافه و کافی شاپ به عنوان تعداد نمونه نهایی مد نظر قرار گرفت. با محوریت شبکه اجتماعی فوراسکوئر،  ۶۲۳۰ نظر مجزا مورد تحلیل و بررسی قرار گرفت. برای رسیدن به هدف این پژوهش، از روش داده کاوی و یادگیری ماشین [2] برای تجزیه و تحلیل متن ها و نظرات کاربران استفاده شد. این پژوهش سعی کرده است، عوامل تاثیر گذار را بر خلق محتوا را با محوریت قرار دادن محتوایی که تولید شده، شناسایی کند و دیدگاه کاربران را با اتکا بر داده های موجود مورد سنجش قرار دهد. با استناد بر نتایج داده کاوی هشت عامل کیفیت خوردنی ها و نوشیدنی ها، قیمت، احساس راحتی و لذت، طراحی داخلی و فضا، برخورد پرسنل، المان های دیداری و شنیداری محیطی، تنوع منو، موقعیت مکانی استخراج شده و نشان می دهد بر روی محتوای ایجاد شده توسط کاربران در زمینه مورد مطالعاتی مورد نظر، موثر است. بر اساس این نتایج بسیاری از کسب و کار های خدماتی موجود می توانند الگوی رفتار مشتریان خود را سنجیده و بر اساس این رفتار استراتژی های بازاریابی آینده خود را طراحی و اجرا کنند.   [1] 1.  User-generated Content   [2] . Machine Learning  
۲۳.

یادگیری ماشین مبتنی بر رویکرد سلسله مراتبی برابری ریسک (مطالعه موردی: پرتفولیو سهام متشکل از 30 شرکت برتر بورس اوراق بهادار تهران)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بهینه سازی پرتفولیو مینیمم واریانس سلسله مراتبی برابری ریسک یادگیری ماشین عملکرد پرتفولیو

حوزه های تخصصی:
تعداد بازدید : ۱۵۰ تعداد دانلود : ۱۲۱
هدف: مسئله تخصیص دارایی ها، به تصمیم گیری تحت شرایط عدم اطمینان نیاز دارد. تشکیل پرتفوی سرمایه گذاری، یکی از مشکلات مالی بسیار رایج است. همواره سرمایه گذاران در تکاپوی تشکیل بهترین پرتفوی برای سرمایه گذاری هستند تا بتوانند بیشترین سود را کسب کنند. تاکنون روش های زیادی برای تشکیل پرتفوی معرفی شده است که مشهورترین آن، رویکرد مارکویتز است. تئوری میانگین واریانس، به دلیل دشواری در تخمین بازده مورد انتظار و کواریانس برای طبقات مختلف دارایی، اشکال های عملی زیادی دارد. هدف از اجرای این پژوهش، یافتن روشی برای بهینه سازی سبد سهام است که در شبیه سازی برون نمونه برای بازار سهام ایران، عملکرد برتری داشته باشد.روش: در این پژوهش، از تکنیک یادگیری ماشین برابری ریسک سلسله مراتبی استفاده شده و نتایج آن با رویکرد مینیمم واریانس مقایسه شده است. برای اجرای این پژوهش، از قیمت پایانی تعدیل شده 30 شرکت بورسی برای 760 روز معاملاتی در دوره زمانی 1397 تا 1399 استفاده شده است.یافته ها: برای ارزیابی عملکرد پرتفولیو از نسبت شارپ برای هر دو دوره درون نمونه و برون نمونه استفاده شد. نتایج به دست آمده از تحلیل درون نمونه و برون نمونه نشان داد که رویکرد برابری ریسک سلسله مراتبی، در مقایسه با رویکرد مینیمم واریانس، عملکرد بهتری دارد.نتیجه گیری: رویکرد برابری ریسک سلسله مراتبی، جایگزین معناداری برای رویکردهای سنتی تخصیص دارایی، از جمله رویکرد مینیمم واریانس است و برای سرمایه گذاران، ابزار مهم مدیریت ریسک محسوب می شود. مدیران سبدگردان و سرمایه گذاران نیز می توانند از این روش برای تخصیص وزن به سبد خود استفاده کنند.
۲۴.

پروتکل عمومی برای اندازه گیری ناوردای چندجمله ای از درجه دو برای حالت خالص N-کیوبیتی اختیاری

کلیدواژه‌ها: درهم تنیدگی چند جمله ای یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۱۰۰ تعداد دانلود : ۹۵
یکی از روش های محاسباتی عمیق و هوشمند برای رده بندی کمیت خاص، استفاده از مفهوم یادگیری ماشینی است. در این مقاله، ما حالت های کوانتومی N-کیوبیتی زوج را با استفاده از ناوردای چند جمله ای از درجه 2 به عنوان معیار درهم تنیدگی رده بندی می کنیم. ابتدا یک پروتکل کلی برای اندازه گیری ناوردای چند جمله ای از درجه 2 یک حالت خالص N-کیوبیتی زوج دلخواه پیشنهاد می کنیم. سپس، براساس تکنیک های یادگیری ماشین، با استفاده از ادغام شبکه عصبی کلاسیک و محاسبات کوانتومی، رده بند ناوردای چند جمله ای از درجه دوی صفر یا غیرصفر می سازیم، حتی اگر الگوی ورودی ناقص باشد. با توجه به برابری معیار درهم تنیدگی چند جزئی واقعی و ناوردای چند جمله ای از درجه 2 برای حالت X، حالت GHZ را به عنوان حالت خاص X در نظر میگیریم و نشان میدهیم که صفر بودن ناوردای چند جمله ای از درجه 2 نشان می دهد که حالت مورد نظر کاملاً جداپذیر است و متعلق به برچسب کلاس "0" است، در غیر این صورت حالت درهم تنیده می شود و متعلق به برچسب کلاس "1" است
۲۵.

مدل سازی پیش بینی جهش های شاخص بازار سهام بر اساس رویکرد شبکه عصبی بازگشتی یادگیری عمیق(مقاله علمی وزارت علوم)

کلیدواژه‌ها: جهش بازار سهام پیش بینی یادگیری ماشین شبکه عصبی بازگشتی

حوزه های تخصصی:
تعداد بازدید : ۲۳۱ تعداد دانلود : ۱۹۲
هدف از انجام این پژوهش بررسی دقت پیش بینی جهش های شاخص سهام بر اساس روش های مختلف یادگیری ماشین در بورس اوراق بهادار تهران است. برای رسیدن به این هدف، در گام نخست جهش های شاخص کل بورس اوراق بهادار تهران طی دوره 1392 تا 1399 بر اساس رویکرد ARJI-GARCH استخراج گردید. در گام بعدی، با بهره گیری از رویکردهای جنگل تصادفی، ماشین بردار پشتیبان، شبکه عصبی مصنوعی و شبکه عصبی بازگشتی مبتنی بر یادگیری عمیق به پیش بینی جهش های شاخص سهام پرداخته شد. بدین منظور، از 80 درصد کل داده ها به عنوان دوره یادگیری ماشین (درون نمونه) و مابقی داده ها به عنوان دوره آزمون (خارج از نمونه) استفاده شده است. نتایج پیش بینی 1، 3 و 6 روزه برای دوره آزمون (خارج از نمونه) نشان می دهد که روش یادگیری ماشین مبتنی بر شبکه عصبی بازگشتی حافظه طولانی کوتاه مدت (LSTM) نتیجه بهتری نسبت به سایر مدل های مورد بررسی برای هر سه افق پیش بینی داشته است.
۲۶.

بررسی قدرت مدل های مبتنی بر هوش مصنوعی در پیش بینی روند قیمت سهام بورس اوراق بهادار تهران(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی قیمت سهام یادگیری ماشین سرمایه گذاری بورس اوراق بهادار تهران

حوزه های تخصصی:
تعداد بازدید : ۲۴۴ تعداد دانلود : ۱۶۰
هدف: در سال های اخیر، روش های پیش بینی داده های سری زمانی مبتنی بر هوش مصنوعی و یادگیری عمیق گسترش بسیاری یافته است. با توجه به اینکه این داده ها در حوزه سرمایه گذاری و پیش بینی قیمت سهام ابعاد بزرگی دارند، روش های سنتی تحلیل داده، به سختی می توانند به یادگیری آن ها بپردازند. در این پژوهش، قدرت مدل های مختلف مبتنی بر یادگیری ماشین، در پیش بینی روند قیمت سهام در بورس اوراق بهادار تهران بررسی شده است. روش: پس از جمع آوری داده های 150 شرکت بزرگ پذیرفته شده در بورس اوراق بهادار تهران، از سال 1390 تا 1399، با تنظیم دقیق روش های یادگیری ماشین برای هر یک از سهام، به پیش بینی روند قیمت سهام و صحت سنجی هر یک از روش ها پرداختیم و آن ها را با هم مقایسه کردیم. در این روش ها، در هر مرحله یادگیری، بخشی از داده ها را به بخش یادگیری و ارزیابی و بقیه را به بخش آزمون اختصاص دادیم. این روش ها عبارت بودند از: مدل های خطی، مدل های خودهم بسته، جنگل تصادفی و شبکه های عصبی. یافته ها: مدل های مبتنی بر یادگیری عمیق نسبت به سایر مدل ها عملکرد بهتری از خود نشان می دهند و در پیش بینی روند کوتاه مدت قیمت سهام، از دقتی حدود 70 تا 80 درصد برخوردارند. همچنین، مدل های یادگیری کم عمق دقت بالاتری داشتند. به طور کلی، بیشتر مدل ها در پیش بینی روندهای منفی سهام، عملکرد بهتری نشان می دهند. نتیجه گیری: در این پژوهش، تلاش شد تا مدل ها با دقت بسیار به کار گرفته شوند. نتایج پژوهش نشان داد که برخلاف یافته های پژوهش های گذشته، این مدل ها نتایج خیره کننده ای در اختیار سرمایه گذاران قرار نمی دهند.
۲۷.

مدل سازی آلودگی خاک به فلزات سنگین با استفاده از روشهای یادگیری ماشین و داده های طیف سنجی(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۳۹ تعداد دانلود : ۱۰۹
معادن و صنایع وابسته به آن، در زمان بهره برداری و پس از متروکه شدن، بر محیط زیست اطراف خود تأثیرگذارند. از جمله این تأثیرات می توان به آلودگی آب های زیرزمینی و سطحی، و نیز آلودگی خاک اشاره کرد. مدل سازی غلظت فلزات سنگین با استفاده از روش های مقرون به صرفه لازمه مدیریت و اصلاح آسیب های واردشده به محیط زیست است. هدف این تحقیق ارائه چارچوبی به منظور مدل سازی فلزات سنگین در خاک با استفاده از طیف سنجی و نیز روش های مدل سازی آماری است. بدین منظور با استفاده از طیف سنجی، نمودار طیفی مربوط به 53 نمونه خاک مربوط به منطقه ای در اطراف یک معدن متروکه در ایالت نیوساوث ولز استرالیا در طول موج های مرئی تا مادون قرمز میانی برداشت شد و مشتق دوم این داده ها محاسبه شد. سپس داده های طیفی مناسب برای مدل سازی غلظت فلزات سنگین شامل سرب، نقره، کادمیوم و جیوه با استفاده از روش انتخاب ویژگی جنگل تصادفی تعیین شدند و به عنوان ورودی برای مدل سازی غلظت فلزات سنگین با استفاده از روش های رگرسیون خطی چندمتغیره، جنگل تصادفی رگرسیون و ماشین بردار رگرسیون به کار گرفته شدند. نتایج نشان داد که طول موج های مادون قرمز میانی دارای اهمیت بیشتری به منظور مدل سازی غلظت فلزات سنگین در این تحقیق هستند. همچنین روش های غیرخطی یادگیری ماشین به خصوص جنگل تصادفی رگرسیون با مقادیر مجذور میانگین مربعات خطا ppm 8/0 و ضریب تعیین 51/0 برای سرب و ppm 4/9 و 46/0 برای کادمیوم دارای عملکرد بهتری نسبت به روش رگرسیون خطی چندمتغیره هستند.
۲۸.

پیش بینی طرح تقلب در گزارشگری مالی با استفاده از رویکرد یادگیری ماشین در فضای چند کلاسه(مقاله علمی وزارت علوم)

تعداد بازدید : ۲۷۱ تعداد دانلود : ۱۸۲
هدف از انجام پژوهش حاضر بررسی عملکرد الگوهای یادگیری ماشین در پیش بینی طرح های تقلب مورد استفاده در گزارشگری مالی در فضای چند کلاسه با استفاده از مجموعه داده نامتوازن است. از این رو صورت های مالی 134 شرکت پذیرفته شده در بورس اوراق بهادار تهران در قلمرو زمانی سال 1387 الی 1399 با استفاده از روش های رگرسیون لجستیک، درخت تصمیم، الگوریتم گرادیان تقویت شده و ماشین بردار پشتیبان مورد تحلیل و بررسی قرار گرفته اند. الگوهای مزبور در محیط پایتون با رویکرد چندکلاسه پیاده سازی و اجرا شدند. معیار ارزیابی عملکرد محاسبه و مقایسه شد. افزون بر این عملکرد الگوهای یادگیری ماشین در تشخیص نوع تقلب در صورت های مالی با رویکرد دوکلاسه و بر اساس مجموعه داده متوازن نیز بررسی گردید. نتایج پژوهش نشان می دهد تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در فضای چند کلاسه وجود دارد و روش ماشین بردار پشتیبان نسبت به سایر روش ها عملکرد بهتری دارد. با تقلیل فضای مسئله به دسته بندی دو کلاسه تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در تشخیص گزارش های مالی مشکوک به "بیش نمایی دارایی، کم نمایی بدهی و هزینه"، "بیش نمایی دارایی و کم نمایی هزینه" و "کم نمایی هزینه و بدهی" تایید نشد. با این حال، عملکرد ماشین بردار پشتیبان بر عملکرد روش رگرسیون لجستیک و درخت تصمیم در پیش بینی گزارش های مالی مشکوک به "بیش نمایی دارایی و درآمد" ارجح است. پژوهش حاضر با توسعه فضای مسئله با هدف دسته بندی چندکلاسه سعی دارد شکاف تحقیقاتی موجود در قلمرو موضوعی پژوهش را رفع نماید.
۲۹.

کاربرد یادگیری ماشین در ارائه الگویی برای پیش بینی ورشکستگی(مقاله علمی وزارت علوم)

تعداد بازدید : ۲۸۷ تعداد دانلود : ۱۵۵
استفاده از ابزارها و روش های پیش بینی سنتی خطای بالایی داشته و در مقایسه با روش های جدیدتر و مدل های غیرخطی عملکرد ضعیف تری دارند. یکی از روش ها و الگوریتم های پرکاربرد در پیش بینی استفاده از یادگیری ماشین است. هدف اصلی این پژوهش بررسی کاربرد یادگیری ماشین در ارائه الگویی برای پیش بینی ورشکستگی 308 شرکت پذیرفته شده در بورس اوراق بهادار تهران در بازه زمانی 1389 تا 1398(3080 سال – شرکت) می باشد که برای آزمون فرضیه ها از رگرسیون چند گانه داده های ترکیبی و به منظور پیاده سازی الگوریتم خوشه بندی Medians-K و محاسبات مربوطه از نرم افزار محاسبات اماری R استفاده گردید. نتایج حاصل از پژوهش نشان می دهد از میان نسبت های مالی مشخص شده در مدل اول فقط نسبت درآمد خالص به کل دارایی و نسبت ارزش بازار حقوق صاحبان سهام به کل ارزش بازار موجب می توانند توانایی مدل پیش بینی ورشکستگی را بهبود ببخشند. همچنین در مدل دوم نسبت های مالی مشخص شده توانایی بهبود مدل پیش بینی ورشکستگی را داشته و با اضافه کردن متغیر Devscore برای گروه هایی که بر اساس صنعت و اندازه ساخته شده اند، مدل اصلاح شده و پیش بینی ورشکستگی را بهبود می بخشد. نتایج حاکی از آن است که یک شرکت در صورت داشتن نسبت های مالی مرتبط با ورشکستگی که پایین تر از میانگین همسانان خوشه ای خود است، احتمالاً ورشکسته می شود.
۳۰.

بررسی تفاوت کیفیت حسابرسی و مدیریت سود در شرکت های ورشکسته و سالم: روش گروه های همسان با استفاده از یادگیری ماشین

تعداد بازدید : ۱۷۵ تعداد دانلود : ۱۴۲
بررسی ویژگی های شرکت های ورشکسته از جمله مدیریت سود و کیفیت حسابرسی در بررسی فرصت طلبی مدیریت و دلایل ورشکستگی از اهمیت بالائی برخوردار است. به همین منظور این پژوهش با تفکیک شرکت ها به دو گروه ورشکسته و سالم به کمک تکنیک گروه های همسان با استفاده از ابزار یادگیری ماشین به بررسی تفاوت مدیریت سود و کیفیت حسابرسی در این دو گروه می پردازد. با بررسی 237 شرکت پذیرفته شده در بورس اوراق بهادار تهران طی دوره زمانی 1390 لغایت 1399 مشخص شده است که بین مدیریت سود و کیفیت حسابرسی در دو گروه شرکت های ورشکسته و سالم تفاوت معناداری وجود دارد. نتایج نشان می دهد که خوشه بندی شرکت ها بر مبنای نسبت های مالی، قدرت پیش بینی کنندگی رویدادهای مهم شرکتی همچون ورشکستگی افزایش می دهد. هدف اصلی پژوهش حاضر بررسی کیفیت حسابرسی و مدیریت سود در شرکت های ورشکسته و سالم با استفاده از تکنیک گروه های همسان است. نتایج این پژوهش می تواند به بهبود مدل های پیش بینی ورشستگی کمک نماید.
۳۱.

طراحی نگاشت مفهومی سرمایه اجتماعی در بستر نظام قضایی با رویکرد متن کاوی(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۶۷ تعداد دانلود : ۱۴۱
پژوهش حاضر با هدف ارایه چارچوب فضای مفهومی سرمایه اجتماعی در بستر نظام قضایی شکل گرفته است. روش پژوهش به شیوه کیفی و با بهره گیری از مرور سیستماتیک و تکنیک متن کاوی انجام گرفت. براساس چارچوب روش، 74 مورد متون منتشرشده به زبان انگلیسی و با کلید واژه های عموماً سرمایه اجتماعی و نظام قضایی و بعضاً اعتماد اجتماعی، مشارکت اجتماعی، عدالت کیفری، و هنجارها در نسبت با نظام قضایی به عنوان نمونه اولیه وارسی شد که از 8 پایگاه علمی در بازه زمانی سال های 2010 تا 2020 استخراج شدند. پس از غربالگری مطالعات مرتبط از نظر عنوان، چکیده، محتوا، روششناسی و یافتههای پژوهشها، 47 مطالعه به روش نمونهگیری هدفمند انتخاب و نتایج و یافتههای آنها با استفاده از نرمافزار پایتون تحلیل شدند. نتایج روند نشر موضوعاتی همچون جرم با فراوانی 953، حقوق یا قانونی بودن رفتارها و اعمال با 580 مورد، دادگاه با 516 مورد، نظام قضایی با 449 مورد، عدالت با 203 مورد و فساد با 270 مورد نشان داد مدیریت و کنترل ورودی پرونده ها و رفتارهای اختلافی جامعه در ربط با نظام قضایی ربط وثیقی با موضوع سرمایه اجتماعی دارد. یافته های ابر کلمات نشان از اهمیت مؤلفه های روابط اجتماعی، شبکه ها، پیوندها، اعتماد اجتماعی، مشارکت اجتماعی، ارزش ها و هنجارها و جامعه مدنی داشت. توصیه پژوهش روی اتخاذ رویکرد فرآیندی در خصوص فضای مفهومی سرمایه اجتماعی و رصد فضای ارزشی و هنجاری جامعه در ربط با نظام قضایی به صورت بسترمند با هدف برخط بودن برنامه ریزی های اجتماعی در حوزه نحوه سنجش پذیری سرمایه اجتماعی تمرکز دارد.
۳۲.

مروری بر رده بندی خوکار متن(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۳۴ تعداد دانلود : ۱۰۶
منابع با سرعت بسیار زیادی در حال رشد و انتشار هستند و در این میان سهم منابع دیجیتال و وبی بسیار مشهود است. به منظور سازماندهی این منابع، تلاش هایی برای رده بندی خودکار صورت گرفته که غالبا از الگوریتم های آماری و یادگیری ماشینی استفاده می کنند. همچنین در برخی منابع، استفاده از رده بندی های کتابخانه ای نیز توصیه شده است. اصلی ترین چالشی که در این زمینه وجود دارد آن است که رده بندی، فرآیندی انتزاعی و نیازمند تفکر است و تکنیک های ماشینی و هوش مصنوعی هنوز نتوانسته اند به طور کامل جایگزین ذهن انسان شوند. در این مقاله ضمن بیان اهمیت رده بندی خودکار به مفاهیم یادگیری ماشینی و تکنیک ها و الگوریتم های پرکاربرد در خوشه بندی و رده بندی مانند کا- نزدیکترین همسایه، مدل بیز، شبکه های عصبی مصنوعی، یادگیری عمیق، و طبقه بندی های ترکیبی پرداخته شد. همچنین مراحل رده بندی خودکار صفحات وب و تکنیک های مورد استفاده در هر مرحله مورد اشاره قرار گرفت. رسیدن به درک روشن تری از موضوع رده بندی خودکار، امکان هم زبانی با متخصصان حوزه هوش مصنوعی و کامپیوتر را فراهم آورده و زمینه ساز پژوهش های میان رشته ای خواهد بود.
۳۳.

پهنه بندی خطر سیلاب در شهر نوشهر با استفاده از مدل های یادگیری ماشین(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پهنه بندی مخاطره سیل یادگیری ماشین یادگیری تجمعی

حوزه های تخصصی:
تعداد بازدید : ۲۴۳ تعداد دانلود : ۱۶۳
اولین گام در جهت رسیدن به برنامه پیشگیری و ایمن سازی شهرها، شناخت مخاطرات و بحران های موجود و اولویت بندی مؤلفه های ریسک پذیری، با توجه به سوابق تاریخی و مطالعات علمی انجام گرفته در تبیین احتمال خطر است. پدیده سیل به عنوان یکی از مخاطرات بسیار پرخطر طبیعی است که در مدیریت بحران باید نگاه ویژه ای به آن معطوف داشت. هدف مطالعه حاضر، مدل سازی و پیش بینی مخاطره سیل طبق ویژگی های شهر بندری نوشهر، با استفاده از مدل های یادگیری ماشین است. بر اساس مرور منابع، ابتدا معیارها و شاخص های مؤثر بر مخاطره سیل، شامل معیار آب وهوا (شاخص بارندگی 6ساعته)، معیار هیدرولوژی (شاخص های ارتفاع رواناب سطحی، تراکم زهکشی، عمق آب زیرزمینی)، معیار توپوگرافی (شاخص های شیب و ارتفاع از سطح دریا)، معیار خاک شناسی (شاخص نوع خاک) و معیار کاربری اراضی (شاخص نوع کاربری زمین) شناسایی شدند و سپس در محیط ArcGIS رستری گردیدند و در نهایت، برای استفاده در مدل ها، به روش فازی استاندارد سازی شدند. در تحقیق حاضر، برای پهنه بندی مخاطره سیل از مدل های یادگیری ماشین، k نزدیک ترین همسایه (Fine KNN، Cubic KNN، Cosine KNN، Weighted KNN)، درخت تصمیم (Fine tree، Medium tree، Coarse tree)، یادگیری تجمعی (Ensemble Subspace KNN ) و WLC استفاده شده است. برای انجام صحت سنجی مدل ها و انتخاب بهترین مدل نیز از روش ROC بر اساس دو معیار ارزیابی صحت و سطح زیر نمودار در خصوص بحران سیل استفاده گردیده است. لایه ها در محیط ArcGIS تهیه و برای انجام مدل سازی و تعیین ضرایب تعیین، به محیط نرم افزاری MATLAB انتقال داده شده اند. نتایج نشان می دهند که مدل یادگیری تجمعی با صحت 96/0 و سطح زیر نمودار 90/0 بهترین و مدل WLC با صحت 61/0 و سطح زیر نمودار 62/0 ضعیف ترین مدل پیش بینی مخاطره سیل در شهر نوشهر است. بنابراین نتیجه خروجی الگوریتم Ensemble (Subspace KNN) برای ارائه نقشه نهایی خطر سیلاب انتخاب گردید.
۳۴.

استخراج عملکرد محل از محتواهای متنی کاربرتولید با استفاده از روش های یادگیری ماشین(مقاله علمی وزارت علوم)

کلیدواژه‌ها: محل عملکرد محل محتواهای کاربرتولید پردازش زبان طبیعی یادگیری ماشین متن

حوزه های تخصصی:
تعداد بازدید : ۱۲۷ تعداد دانلود : ۹۰
امروزه با افزایش روز افزون استفاده کاربران از شبکه های اجتماعی، اطلاعات مکانی مردم گستر رشد چشمگیری داشته است. از میان انواع اطلاعات، محتواهای متنی کاربرتولید غالباً در ساختار مشخصی به اشتراک گذاشته نمی شوند. یکی از ویژگی های عمده این نوع اطلاعات محل مبنا بودن آن ها است.محل های مورد گفت گوی بشر معمولاً همراه با ابهام و وابسته به بافت است. عملکرد محل یا به عبارتی عمده فعالیت هایی که افراد در یک محل انجام می دهند، به عنوان یک بافت در توصیفات محل، ازجمله ویژگی های عمده و متمایز کننده محل است. هدف این تحقیق استخراج عملکرد محل با استفاده از تحلیل محتواهای متنی کاربرتولید به اشتراک گذاشته شده توسط کاربران است. به این منظور ابتدا محل ها و نظرات کاربران در مورد محل ها در وبگاه TripAdvisorبه عنوان محتواهای متنی، جمع آوری شده، سپس از روش های مختلف پردازش زبان طبیعی به منظور آماده سازی و پیش پردازش داده ها استفاده می شود. در ادامه برای هر دیدگاه کاربر یک مجموعه واژگان با استفاده از مقادیر TF-IDFبه عنوان مقادیر بردار ویژگی ساخته می شود. سپس در یک روش نظارت شده این مقادیر به همراه عملکرد محل هابه عنوان ورودی به یک طبقه بندی کننده لجستیک رگرسیون به منظور آموزش مدل داده شده و با استفاده از آن عملکرد محل بر روی داده های آزمایشی پیش بینی شده است. نتایج ارزیابی روش از طریق محاسبه ماتریس درهم ریختگی نشان می دهد، صحت کلی روش پیشنهادی در حدود 96درصد است که رقم قابل توجهی است. همچنین بیشترین دقت و امتیاز F1 برای محل های سرو خوراکی است، درحالی که اقامتگاه ها به دلیل شباهت عملکردی به هتل ها کمترین دقت و امتیاز F1را دارند ولی با این وجود نتایج آن ها نیز قابل اطمینان و رضایت بخش است.
۳۵.

برآورد قیمت آتی پسته در بورس کالای کشاورزی با استفاده از الگوی هیبریدی «تبدیل موجک-گرادیان تقرب یافته درختی»(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی قیمت آتی پسته یادگیری ماشین تئوری موجک مدل گرادیان تقرب یافته درختی و مدل جنگلی تصادفی

حوزه های تخصصی:
تعداد بازدید : ۱۵۶ تعداد دانلود : ۱۲۶
در طی سال های اخیر، بازار بورس کالای ایران همواره با نوسان ها و تلاطم های بی ثبات کننده قیمت همراه بوده است. با توجه به جایگاه مهم پسته در بورس کالای ایران و نیز لزوم به کارگیری ابزارهای مناسب برای تشخیص بهینه قیمت آتی، هدف از انجام این مطالعه، طراحی و ساخت یک مدل هیبریدی مناسب مبتنی بر گردایان تقرب یافته و مقایسه عملکرد آن با سایر مدل های یادگیری ماشین به منظور پیش بینی دقیق قیمت آتی پسته است. نتایج حاصل از بکارگیری تئوری موجک نشان داد که میزان خطای داده های قیمت کاهش یافته و داده ها از یک روند باثبات (نوفه سفید) برخوردار شدند. همچنین نتایج حاصل از انجام اجرای شبکه کدکننده خودکار نشان داد که وقفه بهینه یک، بهترین متغیر ورودی برای پیش بینی قیمت آتی پسته در دوره مورد بررسی است. بر مبنای شاخص های نیکویی برازش، مدل پیشنهادی این مطالعه یعنی «تبدیل موجک-گرادیان تقرب یافته» در مقایسه با دیگر مدل های داده کاوی، دارای عملکرد بهتری در پیش بینی قیمت آتی پسته بود. همچنین، پیش بینی خارج از نمونه با مدل منتخب نشان داد که قیمت های جدید پیش بینی شده با داده های واقعی اختلاف کمی دارد که بیانگر کارایی و دقت مدل هیبریدی منتخب است. بنابراین، مدل پیشنهادی برای پیش بینی قیمت کالاهای کشاورزی توصیه شده و می تواند به عنوان یک شاخص اطمینان و یک ابزاری محاسباتی کارا در مدیریت ریسک برای معامله گران و فعالان بازار بورس کالای ایران به کار گرفته شود.
۳۶.

دسته بندی نظرات خریداران بیمه زندگی بر اساس الگوریتم های متن کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بیمه زندگی پردازش متن داده متنی کشف دانش یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۱۳۵ تعداد دانلود : ۹۹
پیشینه و اهداف: در سال های اخیر صنعت بیمه رشدی چشمگیر داشته است و شرکت های مختلف با خدمات گوناگون پا به عرصه گذاشته اند. بازاریابی موفق یکی از اهداف اصلی شرکت های بیمه است؛ پیداکردن افرادی که احتمال می رود از خدمات بیمه استفاده کنند، بسیار مهم است و منجر به مدیریت هرچه بهتر سرمایه و هزینه ها می شود. هدف اصلی این پژوهش، دسته بندی نظرات خریداران بیمه زندگی یک شرکت بیمه ای بر اساس الگوریتم های متن کاوی است تا بتوان از این دسته بندی به عنوان مبنایی برای پیش بینی مشتریان احتمالی آتی استفاده کنیم. با پیش بینی این دسته از مشتریان می توانیم استراتژی بازاریابی مناسبی برای فروش خدمات خود اتخاذ کنیم. روش شناسی: در این پژوهش به بررسی یک مجموعه داده متنی شامل نظرات خریداران بیمه زندگی پرداخته ایم، چرا که با وجود رشد روز افزون حجم این دسته از داده ها، وجود ابزارهایی جهت سازماندهی، بازیابی و کشف دانش مفید از آنها ضروری است. در همین راستا، تاکنون تحقیقات گسترده ای روی تکنیک های پردازش متن صورت گرفته است. این تکنیک ها، با استفاده از شناسایی و کشف الگوها، به دنبال استخراج اطلاعات مفید از داده های متنی بدون ساختار هستند. در این مقاله نظرات خریداران بیمه زندگی ، به صورت یک مساله مستقل مورد بررسی قرار گرفته است. هدف اصلی، دسته بندی این نظرات بر اساس الگوریتم های متن کاوی به دو دسته مثبت و منفی است. برای رسیدن به این هدف، برای اولین بار در صنعت بیمه از چهار الگوریتم مختلف یادگیری ماشین برای متن کاوی نظرات بیمه گذاران استفاده شده است. یافته ها : با توجه به نتایج حاصله از تکنیک های به کار رفته در این پژوهش می توان گفت که الگوریتم ماشین بردار پشتیبان با میزان 73 درصد، بیشترین میزان معیار دقت پیش بینی را در بین سایر الگوریتم های مورد استفاده در این پژوهش داشته است. در ضمن اکثریت بیمه گذاران نیز نظر مثبتی در ارتباط با خدمات دریافتی داشته اند و این بدان معناست که اکثر مشتریان استفاده کننده از خدمات، از شرکت راضی هستند. نتیجه گیری: اکثریت بیمه گذاران مایلند در آینده نیز این خدمت بیمه ای را در سبد خرید خود داشته باشند. لذا مسئولین شرکت می توانند، مشتریان احتمالی خود را از میان این افراد پیدا و برای فروش خدمات خود بر روی آنها سرمایه گذاری کنند. با این استراتژی بازاریابی، مدیران می توانند هزینه های شرکت را کاهش داده و با صرفه جویی در هزینه از این راه، قیمت خدمات خود را کاهش دهند. همه ما می دانیم که هدف هر شرکتی تعیین قیمت برای به حداکثررساندن سود است که به آن قیمت بهینه نیز گفته می شود. تعیین قیمت بهینه به درک هزینه ها، کشش قیمت، ترجیحات مصرف کننده و اقدامات استراتژیک بازاریابی ما بستگی دارد. با این نتایج می توانیم استراتژی بازاریابی مناسب خود را انتخاب کنیم. زیرا تعیین یک قیمت حق بیمه بهینه یک مزیت رقابتی برای شرکت ها ایجاد می کند. مانند هر صنعت دیگری، قیمت تابع قانون عرضه و تقاضا است. از آنجایی که دریافت بهترین قیمت جزو اولویت های اصلی مشتریان بیمه است، حتی درصد کمی تغییر در قیمت حق بیمه باعث می شود بسیاری از مشتریان بیمه گران خود را تغییر دهند. بنابراین، قیمت گذاری بهینه در بخش بیمه، حداکثر سود را ممکن می سازد.
۳۷.

اندازه گیری شاخص نا اطمینانی اقتصادی رسانه بنیان با الگوریتم های یادگیری ماشین در ایران و تأثیر آن بر نرخ ارز(مقاله علمی وزارت علوم)

کلیدواژه‌ها: نااطمینانی اقتصادی رسانه متن کاوی یادگیری ماشین نرخ ارز

حوزه های تخصصی:
تعداد بازدید : ۱۵۲ تعداد دانلود : ۱۰۹
هدف اصلی مقاله اندازه گیری شاخص نا اطمینانی اقتصادی با استفاده از اخبار منتشر شده در شبکه های اجتماعی است. این روش اندازه گیری با فراگیری استفاده از شبکه های اجتماعی اهمیت بالایی پیدا کرده است. در این مقاله، با پایش و تحلیل 3,117,960 خبر از 28 کانال تلگرامی پرمخاطب و اثرگذار ایران، شاخص نا اطمینانی اقتصادی در ایران را از ژانویه 2017 تا دسامبر 2020 اندازه گیری شد. برای تحلیل این اخبار از روش های «یادگیری ماشین با ناظر» بهره گرفته شد. در مرحله اول 13404 خبر توسط ارزیابان انسانی برحسب اثرگذاری بر نا اطمینانی برچسب گذاری شد. سپس با استفاده از چهار الگوریتم (« C4. 5 » از روش های درخت تصمیم، «پرسپترون چندلایه» از روش های شبکه عصبی مصنوعی، «لجستیک» از روش های تابع محور و «بیز ساده» از روش های بیزی) برچسب گذاری کل اخبار انجام شد. شاخص نا اطمینانی اقتصادی به صورت شمارشی و بر اساس تعداد اخباری که اثرگذار بر نا اطمینانی اقتصادی هستند، اندازه گیری و مقدار این شاخص استاندارد شده و سپس کیفیت شاخص با شواهد تاریخی، برچسب گذاری مجدد و مقایسه با شاخص مبتنی بر داده های گوگل ارزیابی شد. شاخص محاسبه شده با وقایع مهم دوره مطالعه مانند خروج آمریکا از برجام، تحریم نفتی و بالا گرفتن تقابل آمریکا با ایران در ترور سردار سلیمانی همخوانی دارد. برآورد تأثیر نا اطمینانی اقتصادی رسانه بنیان بر نرخ ارز با مدل گارچ، اثر مثبت و معنی دار این نا اطمینانی را نشان می دهد.
۳۸.

مقایسه کارایی مدل های یادگیری ماشین و مدل های آماری در پیش بینی ریسک مالی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیش بینی ریسک مالی ماشین بردار پشتیبان تکاملی یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۳۱۲ تعداد دانلود : ۱۷۳
هدف این پژوهش، مقایسه کارایی مدل های یادگیری ماشین (32 مدل) و مدل های آماری (14 مدل)، در پیش بینی ریسک مالی 145 شرکت پذیرفته شده در بورس اوراق بهادار تهران طی بازه زمانی 1389 تا 1398 و انتخاب بهترین مدل با استفاده از تکنیک های بهینه سازی پیشرفته می باشد. یافته های پژوهش با استفاده از آزمون مقایسه دقت ضرایب پیش بینی، بیانگر آن است که با اطمینان 99 درصد، دقت پیشبینی مدلهای یادگیری ماشین، بیشتر از مدلهای آماری است. همچنین بهترین مدل یادگیری ماشین پس از بهینه سازی، مدل ماشین بردار پشتیبان تکاملی با دقت پیش بینی 99.86درصد و مقدار سطح زیر منحنی برابر0.998بوده است. علاوه بر این، نسبت های مالی تعهدی با دقت پیش بینی99.45درصد و نسبت های مالی فعالیت با دقت پیش بینی 98.62درصد توانستند در مقایسه با سایر نسبت های مالی در استفاده از ماشین بردار پشتیبان تکاملی به منظور پیش بینی ریسک مالی عملکرد بهتری داشته باشند. از سوی دیگر ریسک مالی پیش بینی شده بر اساس صنایع مختلف، متفاوت بوده است. بنابراین مشخص شد که مدل های یادگیری ماشین به دلیل عدم برخورداری از محدودیت هایی که مدل های آماری با آن مواجهه هستند می توانند به عنوان ابزاری مهم، در پیش بینی ریسک مالی شرکت ها به کار روند.
۳۹.

پیش بینی خرید بیمه نامه حرف و مشاغل آزاد سازمان تامین اجتماعی با استفاده از الگوریتم طبقه بندی درخت تصمیم و جنگل تصادفی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بیمه بازنشستگی حرف و مشاغل آزاد سازمان تأمین اجتماعی داده کاوی یادگیری ماشین طبقه بندی

حوزه های تخصصی:
تعداد بازدید : ۱۵۸ تعداد دانلود : ۱۴۳
پوشش بیمه سازمان تامین اجتماعی برای حرف و مشاغل آزاد به صورت اختیاری در سه نرخ 12، 14 و 18 درصد ارائه می شود اما نگاه به آمار نشان می دهد که تقاضای این بیمه نامه ها بسیار پایین است. این پژوهش با استفاده از داده کاوی و با به کارگیری دو الگوریتم یادگیری ماشین یعنی درخت تصمیم و جنگل تصادفی به بررسی مشخصه های خریداران این نوع بیمه نامه ها پرداخته و با ارائه یک مدل طبقه بندی، رفتار آن ها را پیش بینی می کند تا از این طریق به سازمان تأمین اجتماعی در جهت بهبود مدیریت ارتباط با مشتری کمک کند. برای این منظور، از اطلاعات 1286174 نفر از خریداران انواع بیمه نامه های حرف و مشاغل آزاد سال 1399 استفاده شد که مشخصه های سن، جنسیت، متوسط درآمد ماهانه، میزان سابقه کار و نوع بیمه نامه خریداری شده را در بر می گیرد. نتایج به دست آمده نشان می دهند که زنان به طور عمده متقاضی بیمه نامه با نرخ 12 درصد هستند در حالی که مردان به دلیل بر عهده داشتن بار تکفل خانواده عمدتاً تمایل به خرید بیمه نامه های با نرخ 14 و 18 درصدی دارند. همچنین، در مردان با افزایش سن، درآمد و سابقه، تقاضای بیمه های با نرخ 14 و 18 درصد افزایش می یابد، اما چنین روندهایی برای زنان وجود ندارد. طبق نتایج به دست آمده متغیرهای میزان سابقه کار و پس از آن جنسیت در انتخاب نوع بیمه نامه تعیین کننده هستند، به گونه ای که طبق پیش بینی مدل افراد با سابقه کار کمتر از 5/4 سال متقاضیان قطعی بیمه نامه 12 درصدی شناخته شده اند. با توجه به نتایج و انگیزه پایین زنان و جوانان برای انتخاب بیمه های با خدمات گسترده تر، سازمان تأمین اجتماعی می-تواند ازطریق ارائه مشوق ها یا خدمات کوتاه مدت، جذابیت این نوع بیمه نامه با خدمات گسترده تر را در بین این گروه خاص افزایش دهد.
۴۰.

رویکرد ترکیبی پیش بینی تقاضای کانال همه جانبه یکپارچه، با استفاده از یادگیری ماشین - خوشه بندی سری های زمانی با الگوریتم پیچش زمانی پویا و شبکه های عصبی مصنوعی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: شبکه های عصبی مصنوعی پیش بینی تقاضا الگوریتم پیچش زمانی پویا یادگیری ماشین کانال همه جانبه یکپارچه

حوزه های تخصصی:
تعداد بازدید : ۱۳۶ تعداد دانلود : ۱۳۹
پذیرش کانال های آنلاین و تجارت الکترونیک، به تغییرات مداوم و پویا در صنعت خرده فروشی، به عنوان یک توسعه اجتناب ناپذیر منجر شده و بسیاری از شرکت ها را با چالش انتخاب مناسب ترین کانال فروش، برای ارائه یک تجربه یکپارچه به مشتریان خود مواجه کرده است. خرده فروشی همه جانبه یکپارچه، با مفهوم ادغام همه کانال ها، ضمن ایجاد تجربه مذکور، باعث افزایش پیچیدگی فرآیندهای پیش بینی و برنامه ریزی می شود. این پژوهش با هدف کاهش عدم اطمینان تقاضای ناشی از خطای پیش بینی، ازطریق در نظر گرفتن رفتار خرید مشتریان در پیش بینی و به کمک استفاده از روش های یادگیری ماشین، روشی دقیق تر برای پیش بینی تقاضای کانال همه جانبه یکپارچه ارائه کرده است. به این منظور، ابتدا داده های فروش شرکت مطالعه شده، جمع آوری و با استفاده از الگوریتم پیچش زمانی پویا خوشه بندی شد؛ سپس بر هر خوشه یک بار شبکه عصبی اتو رگرسیو غیرخطی و بار دیگر، شبکه عصبی اتو رگرسیو غیرخطی با ورودی برون زا اجرا و نتایج حاصل از شبکه های عصبی با معیارهای ارزیابی عملکرد R 2 و RMSE با روش استفاده شده در شرکت مطالعه شده، مقایسه شد. مقایسه نتایج نشان داد عملکرد شبکه عصبی اتو رگرسیو غیرخطی، با ورودی برون زا بر داده های خوشه بندی شده به روش پیچش زمانی پویا، برای کاهش خطای پیش بینی تقاضا در کانال همه جانبه یکپارچه، نسبت به دو روش دیگر برتری دارد.