کاربرد XGBoost برای پیش بینی درماندگی مالی شرکت های پذیرفته شده در فرابورس و بورس اوراق بهادار تهران (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
هدف این مقاله، پیش بینی درماندگی مالی بالقوه شرکت های پذیرفته شده در فرابورس و بورس اوراق بهادار است. بدین منظور، دامنه گسترده ای از ویژگی ها از جمله متغیرهای حسابداری تعهدی، حسابداری نقدی، بازار سهام، مکانیسم های حاکمیت شرکتی و شاخص های اقتصاد کلان برای پیش بینی درماندگی مالی شرکت های نمونه شناسایی شده اند. نمونه نهایی شامل 421 شرکت و در نتیجه، 3670 شرکت-سال مشاهده است. سپس، داده آماده شده با استفاده از نسبت 70 به 30 به مجموعه داده آموزشی و آزمایشی تفکیک شد. در این پژوهش، تکینک های پیش پردازش داده یادگیری ماشین نظیر استانداردسازی نمره Z، وان-هات انکدینگ، اعتبارسنجی متقابل K لایه طبقه ای، همراه با مهندسی ویژگی برای بهبود عملکرد طبقه بندی کننده بکار گرفته شدند. روش اعتبارسنجی متقابل K لایه طبقه ای با (5=K) برای برآورد عملکرد پیش بینی مدل طی مرحله آموزش استفاده شد. طی مرحله آموزش، میزان سازی اَبرپارامتر مدل با استفاده از جستجوی شبکه ای انجام شد. افزون بر این، تکنیک SMOTE همراه با معیار مختص مسائل نامتوازن یعنی نمره F1 برای غلبه بر مسأله نامتوازنی افراطی کلاس ها استفاده شده است.بر اساس نتایج تجربی، مدل XGBoost به نمرهF1، ضریب همبستگی متیوز، فراخوانی و دقتی به ترتیب برابر با 90%، 90%، 100% و 82% بر روی مجموعه آموزشی دست یافت. سرانجام، مدل پیشنهادی بر روی مجموعه آزمایشی کنار گذاشته شده آزمون شد که به نمرهF1، ضریب همبستگی متیوز، فراخوانی و دقتی به ترتیب برابر با 52%، 52%، 73% و 41% بر روی مجموعه آزمایشی منجر شد. این اطلاعات، ابزار قدرتمندی برای پیش بینی درماندگی مالی شرکت ها فراهم می کنند.Application of XGBoost to Predict Financial Distress of the Listed Companies on Tehran Stock Exchange (TSE) and Iran Fara Burse (IFB)
The purpose of this article is to predict the potential financial distress of the listed companies on Tehran Stock Exchange (TSE) and Iran Fara Bourse (IFB). To do so, a wide range of features including accrual accounting variables, cash-based accounting variables, market-based variables, corporate governance mechanisms, and macroeconomic indicators have been identified to prospectively predict the financial distress in the companies.The final sample includes 421 firms leading to 3,670 firm-year observations. The prepared data, was then split into a train and test data set using a 70/30 ratio.In this research, various data pre-processing machine learning techniques i.e., Z-score standardization, one-hot encoding, stratified K-fold validation combined with feature engineering are applied to improve classifier performance. Stratified K-fold cross validation method, (with k = 5) was used for estimation of model prediction performance during training phase. During the training phase, hyper-parameter tuning of a model was carried out using a grid-search. Furthermore, SMOTE technique in conjunction with the proposed imbalance-oriented metric i.e., F1 score were used to overcome the extreme class imbalance issue.Based on the experimental results, the tuned XGBoost model achieved a f1-score, MCC, recall and precision of respectively, 90%, 90%, 100% and 82% on the training set. Finally, the proposed model was tested on the hold-out test set which resulted in a f1-score, MCC, recall and precision of 52%, 52%, 73% and 41%, respectively. This information provides a powerful tool for predicting the financial distress of companies.