مقایسه دقت مدل های آماری و یادگیری ماشین برای پیش بینی نگهداشت وجه نقد و ارائه مدل بهینه (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
پژوهش حاضر، مقایسه دقت مدل های یادگیری ماشین و آماری در پیش بینی نگهداشت وجه نقد را با استفاده از مجموعه متغیر های مالی و اقتصادی مورد بررسی قرار داده است. روش شناسی پژوهش را می توان به سه مرحله گزینش مجموعه داده و متغیرها، مدل سازی و قیاس تقسیم بندی کرد. نمونه آماری پژوهش حاضر بورس اوراق بهادار تهران است که داده های 173 شرکت در طی بازه زمانی 1400-1389 مورد بررسی قرارگرفته است. نتایج حاکی از دقت بالای مدل رگرسیون نمادین با استفاده از الگوریتم ژنتیک با ضریب دقت 71 درصد در این زمینه است. بعدازآن به ترتیب مدل های تقویت گرادیان درختی، رگرسیون مارس، شبکه عصبی و تقویت گرادیان فوق العاده به عنوان دقیق ترین مدل ها جهت پیش بینی ارزیابی شدند. درنهایت مدل K نزدیک ترین همسایه ضعیف ترین دقت پیش بینی را از خود نشان داد. همچنین اگرچه مدل های آماری دقت پیش بینی پایینی را نشان دادند اما بااین حال از برخی مدل های یادگیری ماشین ضریب دقت بالاتری را کسب کردند. همچنین نتایج نشان داد استفاده از رگرسیون لاسو موجب بهبود دقت مدل های آماری و برخی از مدل های یادگیری ماشین می گردد. این پژوهش می تواند زوایای جدیدی از تکنیک های پیش بینی نگهداشت وجه نقد را در مطالعات مالی بیفزاید؛که تاکنون در ادبیات مالی مورد بررسی قرار نگرفته است.Comparison of Statistical and Machine Models for Predicting Cash Holdings and Providing the Optimal Model
The current paper has investigated the comparison of the accuracy of machine learning and statistical models in predicting cash holdings using a set of financial and economic variables. Research methodology can be divided into three stages: selection of data set and variables, modeling and estimation. The statistical sample of the current research is the Tehran Stock Exchange, where the data of 173 companies have been analyzed during the period of 2010-2021. The results indicate the high accuracy of the symbolic regression model using the genetic algorithm with an accuracy factor of 71% in this field. After that, Gradient Boosted Trees, MARS regression, neural network and XGboost models were evaluated as the most accurate models for prediction. Finally, the KNN model showed the weakest prediction accuracy. Also, although the statistical models showed low prediction accuracy, they obtained a higher accuracy coefficient from some machine learning models. Also, the results showed that the use of Lasso regression improves the accuracy of statistical models and some machine learning models. This research can add new angles of cash retention forecasting techniques in financial studies, which have not been investigated in financial literature so far.