انتخاب ویژگی های مناسب برای مدل پیش بینی شاخص بورس اوراق بهادار تهران بر مبنای تکنیک کاهش ابعاد (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
هدف: هدف اصلی این پژوهش، انتخاب مدل مناسب برای پیش بینی روزانه شاخص کل بورس اوراق بهادار تهران است. در این راستا، از تکنیک های کاهش ابعاد، جهت انتخاب ویژگی های مؤثر و معرف، به منظور افزایش دقت مدل انتخابی استفاده شده است. روش: با توجه به اینکه کاهش ابعاد می تواند با دو روش متفاوت (انتخاب و استخراج ویژگی) اجرا شود، در این پژوهش، هر دو روش برای انتخاب ویژگی های مناسب مدل پیش بینی به کار برده شده است؛ به طوری که برای انتخاب ویژگی ها از الگوریتم MID و برای استخراج ویژگی ها از الگوریتم PCA استفاده می شود. در این راستا، پس از جمع آوری 34 ویژگی مالی و اقتصادی مؤثر بر بازار سهام، به اولویت بندی ویژگی ها با الگوریتم MID اقدام شده است، سپس با مقایسه عملکرد دو مدل مختلف شبکه عصبی با نام های RBFو DNN که به ترتیب از مهم ترین و بدیع ترین مدل ها هستند، مدل مناسب انتخاب شده است. در ادامه با استفاده از دو نوع تکنیک کاهش ابعاد، دقت پیش بینی مدل انتخابی بررسی شده و روش مناسب برای انتخاب ویژگی های ورودی مدل پیش بینی شناسایی شده است. یافته ها: با تحلیل نتایج به دست آمده مشخص شد که مدل RBF در پیش بینی روزانه شاخص کل بورس اوراق بهادار تهران دقت بیشتری دارد. همچنین با مقایسه عملکرد دو نوع تکنیک کاهش ابعاد، مشخص شد که الگوریتم MID نسبت به الگوریتم PCA در انتخاب متغیرهای ورودی مدل RBF نتیجه بهتری را ارائه کرده است. بنابراین با توجه به اولویت بندی ویژگی ها با الگوریتم MID و الگوی تغییر مقدار خطا با افزایش تعداد ویژگی ها در مدل RBF، الگوریتم ISF_MID، برای انتخاب ویژگی های مناسب مدل پیش بینی شاخص بورس پیشنهاد شد. با استفاده از این الگوریتم می توان با کمترین تعداد ویژگی، بیشترین دقت را در پیش بینی شاخص بورس به دست آورد. نتیجه گیری: روش پیشنهاد شده در این پژوهش جهت شناسایی، اولویت بندی و انتخاب ویژگی های مناسب برای مدل پیش بینی، با توجه به سادگی و اثربخشی استفاده از آن، می تواند در حوزه های مختلف مدل سازی، از جمله بازار سرمایه، بازار ارز و مانند آن ها مفید واقع شود.Feature Selection for the Prediction Model of the Tehran Stock Exchange Index by Dimensionality Reduction Techniques
Objective: The main purpose of this study is to select an appropriate model for daily prediction of the total index of the Tehran Stock Exchange (TEDPIX). In this regard, dimension reduction techniques have been used to select effective and representative features to increase the accuracy of the selected model.
Methods: Since dimensionality reduction can be performed by two different methods (feature selection and extraction), in this study, two methods were used simultaneously to select the appropriate features of the prediction model. Hence, the MID algorithm was used to select the features, and the PCA algorithm was used to extract them. In this regard, after collecting 34 financial and economic features affecting the stock market, the features were prioritized by the MID algorithm. Then, the appropriate model was selected by comparing the performance of two different neural network models called RBF and DNN, which are respectively the most important and innovative of the extant models. Then, using two types of dimensionality reduction techniques, the prediction accuracy of the selected model was examined. The appropriate method for selecting the input features of the prediction model was identified, accordingly.
Results: Analysis of the obtained results showed that the RBF model comes with more accuracy in the daily prediction of the Tehran Exchange Dividend and Price Index. Also, by comparing the performance of the two types of dimensionality reduction techniques, it was found that compared with the PCA algorithm, the MID algorithm brings better results in selecting the input variables of the RBF model. Therefore, according to the priority of features with the MID algorithm and the pattern of changing the level of error by increasing the number of features in the RBF model, the ISF-MID algorithm was proposed to select the appropriate features of the stock index prediction model. Using this algorithm, with the minimum number of features, can end in the highest accuracy in predicting the total index of the Tehran Stock Exchange.
Conclusion: The proposed method can identify, prioritize and select appropriate features for the prediction model, due to the simplicity and effectiveness of its use. It can also be useful in various areas of modeling, including the capital market, foreign exchange market, etc.