آرشیو

آرشیو شماره ها:
۵۲

چکیده

هدف از انجام پژوهش حاضر بررسی عملکرد الگوهای یادگیری ماشین در پیش بینی طرح های تقلب مورد استفاده در گزارشگری مالی در فضای چند کلاسه با استفاده از مجموعه داده نامتوازن است. از این رو صورت های مالی 134 شرکت پذیرفته شده در بورس اوراق بهادار تهران در قلمرو زمانی سال 1387 الی 1399 با استفاده از روش های رگرسیون لجستیک، درخت تصمیم، الگوریتم گرادیان تقویت شده و ماشین بردار پشتیبان مورد تحلیل و بررسی قرار گرفته اند. الگوهای مزبور در محیط پایتون با رویکرد چندکلاسه پیاده سازی و اجرا شدند. معیار ارزیابی عملکرد محاسبه و مقایسه شد. افزون بر این عملکرد الگوهای یادگیری ماشین در تشخیص نوع تقلب در صورت های مالی با رویکرد دوکلاسه و بر اساس مجموعه داده متوازن نیز بررسی گردید. نتایج پژوهش نشان می دهد تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در فضای چند کلاسه وجود دارد و روش ماشین بردار پشتیبان نسبت به سایر روش ها عملکرد بهتری دارد. با تقلیل فضای مسئله به دسته بندی دو کلاسه تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در تشخیص گزارش های مالی مشکوک به "بیش نمایی دارایی، کم نمایی بدهی و هزینه"، "بیش نمایی دارایی و کم نمایی هزینه" و "کم نمایی هزینه و بدهی" تایید نشد. با این حال، عملکرد ماشین بردار پشتیبان بر عملکرد روش رگرسیون لجستیک و درخت تصمیم در پیش بینی گزارش های مالی مشکوک به "بیش نمایی دارایی و درآمد" ارجح است. پژوهش حاضر با توسعه فضای مسئله با هدف دسته بندی چندکلاسه سعی دارد شکاف تحقیقاتی موجود در قلمرو موضوعی پژوهش را رفع نماید.

Financial Reporting Fraud Scheme Prediction via Machine Learning Approach – Multiclass Classification

This paper attempts to evaluate the performance of machine learning models in fraudulent financial Reporting schemes prediction via a multi-classification approach and using an unbalanced dataset. Therefore, the financial statements of 134 companies listed on the Tehran Stock Exchange from 2009 to 2021 were investigated by Logistic Regression, Decision Tree, Boosting Algorithms, and Support Vector Machine. Models were programmed with Python and Performance indicators were calculated and compared. Furthermore, the machine learning model’s performance was investigated in binary classification with the balanced dataset to predict each fraud scheme exclusively. According to the results via a multi-classification approach, then the significant difference between machine learning models’ performance was approved. Support Vector Machin was preferred in multiclass problem space with the unbalanced data set. To predict fraud schemes via binary classification, a significant difference between machine learning models’ performance was not approved except to predict the “Overstatement assets and income” scheme. Support Vector Machin was preferred to Logistic Regression and Decision Tree model. The present research attempts to fill the research gap in the research area by developing machine learning models with a multi-classification approach.

تبلیغات