ارائه مدلی برای پیش بینی قیمت سهام مبتنی بر CNN-LSTM بهینه شده در بورس اوراق بهادار تهران (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
هدف: یکی از مهم ترین اهداف سرمایه گذاران و معامله گران بازار های مالی شناخت رفتار قیمت سهام است. پیش بینی قیمت، می تواند به افراد در مورد خرید، فروش یا نگهداری سهام کمک کند تا با زمان بندی موثر معاملات، سود بالقوه را به حداکثر یا زیان را به حداقل برسانند. به دلیل رفتار غیر خطی قیمت و وابستگی آن به عوامل گوناگون پیش بینی قیمت کار دشواری است که برای مقابله با این چالش، در این پژوهش از مدل های یادگیری عمیق کمک گرفته می شود که زیر شاخه ای از مدل های یادگیری ماشین هستند. ساختار مدل های یادگیری عمیق به دلیل تمرکز بر روی تعداد لایه های بیشتر و استفاده از گره های به هم پیوسته (نورون ها) در مواجه با مقادیر زیادی داده عملکرد مناسبی دارند و به دلیل توانایی آن ها در شناخت الگو ها و روابط، امکان ارائه پیش بینی دقیق تری از قیمت ها را فراهم می کنند.روش: در این پژوهش، برای پیش بینی قیمت سهام در بازار بورس اوراق بهادار تهران از دو مدل پیشنهادی LSTM-CNN و CNN-LSTM به وسیله بهینه سازی هایپرپارامتر ها توسط الگوریتم PSO که یک الگوریتم بهینه سازی مبتنی بر جمعیت است و تکنیک های تقویت مدل شامل: آموزش خصمانه، مکانسیم توجه و بلوک باقی مانده استفاده شده است. این مدل ها با مدل های CNN،LSTM وCNN-LSTM مورد مقایسه قرار گرفته اند. جهت دستیابی به این هدف، داده های10سهم از تاریخ20 شهریور 1392 تا تاریخ20 شهریور 1402 مورد بررسی قرارگرفته است.داده های ورودی شامل: قیمت های تعدیل شده سهم، اندیکاتور ها، اسیلاتور ها، قیمت دلارآزاد آمریکا و نرخ تورم می باشد.یافته ها: مقایسه نتایج معیار های ارزیابی شامل چهار معیار RMSE، MAE، R-squared و MAPE نشان از عملکرد مطلوب دو مدل پیشنهادی با سایر مدل ها می دهد. علاوه بر این، مدل پیشنهادی LSTM-CNN توانسته بهترین عملکرد را به ثبت رساند. همچنین، بررسی نتایج دو مدل پیشنهادی، با و بدون الگوریتم PSO مشخص کرد که این الگوریتم به بهینه سازی مدل ها کمک می کند. در نهایت، بررسی استراتژی های مبتنی بر مدل های پیشنهادی بر روی پنج سهم از پنج صنعت مختلف در چهار دوره زمانی نشان از عملکرد مالی برتر آن ها می دهد. به عبارت دیگر، مدل های پیشنهادیLSTM-CNN و CNN-LSTMتوانسته اند در معیار بازده مالی و نسبت شارپ در مقایسه با سایر استراتژی ها موفقیت مطلوبی به دست آورند که مدل پیشنهادیLSTM-CNN مطلوب ترین عملکرد را به ثبت رسانده است.نتیجه گیری: هایپرپارامترها، پارامترهایی هستند بر روی خروجی مدل ها تاثیر دارند و با تغییر هرکدام از این هایپارامترها نتایج مختلفی به دست می آید که می تواند مناسب یا غیر مناسب باشند این پارامترها در طول آموزش یاد نمی گیرند و باید قبل از آموزش تنظیم شوند. طبق نتایج به دست آمده، بهینه سازی هایپرپارامترها، می تواند سهم را بر اساس رفتار آن سهم بهینه کند که این امر منجر به پیش بینی دقیق تر قیمت می شود. همچنین، با استفاده از مدلLSTM-CNN استخراج ویژگی ها از داده ها و شناسایی و درک وابستگی ها در ویژگی های استخراج شده به طور مناسب تری از CNN-LSTM صورت می گیرد که می تواند در بهبود دقت پیش بینی کمک کند.Presenting an Optimized CNN-LSTM Model for Stock Price Forecasting in the Tehran Stock Exchange
Purpose: One of the primary objectives for investors and traders in financial markets is understanding stock price behavior. Accurate price predictions can assist individuals in making informed decisions about buying, selling, or holding stocks, thereby maximizing potential profits or minimizing losses through effective transaction timing. Due to the nonlinear behavior of prices and their dependence on various factors, predicting stock prices is challenging. To address this, the research employs deep learning models, a subset of machine learning models known for their capability to handle large datasets. Their structure, featuring multiple layers and interconnected nodes (neurons), allows for recognizing patterns and relationships, facilitating more accurate price predictions.Method: This study utilizes two proposed models, LSTM-CNN and CNN-LSTM, to predict stock prices in the Tehran Stock Exchange. These models are optimized through hyperparameter tuning using the PSO algorithm, a population-based optimization technique, along with model enhancement techniques such as adversarial training, attention mechanism, and residual blocks. The proposed models are compared with CNN, LSTM, and CNN-LSTM models. Data from 10 stocks, spanning September 11, 2013, to September 11, 2023, were analyzed. The input data include adjusted stock prices, indicators, oscillators, the free market US dollar price, and the inflation rate.Findings: Comparative results of evaluation metrics, including RMSE, MAE, R-squared, and MAPE, indicate that the two proposed models outperform other models. The LSTM-CNN model, in particular, has demonstrated the best performance. Evaluation of the proposed models, with and without the PSO algorithm, reveals that the algorithm aids in optimizing the models. Furthermore, strategy analysis based on the proposed models, applied to five stocks from five different industries over four time periods, shows superior financial performance. In essence, the LSTM-CNN and CNN-LSTM models have achieved notable success in terms of financial returns and the Sharpe ratio compared to other strategies, with the LSTM-CNN model showing the most favorable performance.Conclusion: Hyperparameters are critical as they impact model outcomes, and varying these parameters can produce different results, which may be either suitable or unsuitable. These parameters are not learned during training and must be set before training. The findings suggest that hyperparameter optimization can fine-tune models based on stock behavior, leading to more accurate price predictions. Additionally, the LSTM-CNN model excels in feature extraction and understanding dependencies within the data compared to the CNN-LSTM model, thereby enhancing prediction accuracy. In summary, leveraging deep learning models, specifically LSTM-CNN and CNN-LSTM, optimized with PSO and advanced techniques, significantly improves stock price prediction in the Tehran Stock Exchange. The results indicate that these models, particularly the LSTM-CNN, offer superior performance in financial return metrics and prediction accuracy. This approach provides a robust framework for investors and traders seeking to make informed decisions in financial markets, highlighting the importance of advanced machine learning techniques in enhancing predictive analytics.