مقاله حاضر به بررسی سودمندی رگرسیون های تجمیعی و روش های انتخاب متغیرهای پیش بین بهینه (شامل روش مبتنی بر همبستگی و ریلیف) برای پیش بینی بازده سهام شرکت های پذیرفته شده در بورس اوراق بهادار تهران می پردازد. به منظور ارزیابی عملکرد رگرسیون تجمیعی، معیارهای ارزیابی (شامل میانگین قدرمطلق درصد خطا، مجذور مربع میانگین خطا و ضریب تعیین) مربوط به پیش بینی این روش، با رگرسیون خطی و شبکه های عصبی مصنوعی مقایسه شده است. همچنین به منظور ارزیابی عملکرد روش های انتخاب متغیرهای بهینه پیش بین، معیارهای ارزیابی حاصل از پیش بینی با استفاده از متغیرهای انتخاب شده توسط این روش ها با معیارهای حاصل از پیش بینی با استفاده از کلیه متغیرها مقایسه شده است. یافته های تجربی مربوط به بررسی 101 شرکت پذیرفته شده در بورس اوراق بهادار تهران در سال های 1383 الی 1392 حاکی از عملکرد بهتر روش تجمیعی نسبت به رگرسیون خطی و شبکه های عصبی مصنوعی است. افزون بر این، یافته ها حاکی از آن بود که پیش بینی با استفاده از متغیرهای انتخاب شده در روش های مبتنی بر همبستگی و ریلیف، به طور معناداری عملکرد پیش بینی را نسبت به استفاده از کلیه متغیرها افزایش می دهد.
Abstract
Present study investigates the usefulness of ensemble regression and feature selection methods (including correlation-based feature selection and Relief) in predicting stock returns of companies listed on Tehran Stock Exchange. For performance evaluation of ensemble regression, evaluation criteria (including mean absolute percentage error, root mean squared error and coefficient of determination) of this method compared with linear regression and artificial neural networks. Also, for performance evaluation of feature selection methods, evaluation criteria of these methods compared with using all variables. The experimental results of investigating 101 companies listed in Tehran Stock Exchange in 2004-2013 indicate that ensemble regression outperforms the linear regression and artificial neural networks. Furthermore, the results show that selected variables with correlation-based feature selection and Relief result in better prediction in compare with using all variables.
Keywords : Stock Returns Prediction, Ensemble Regression, Feature Selection Methods.