آرشیو

آرشیو شماره ها:
۴۶

چکیده

حجم اطلاعات بازار سرمایه به طرز چشمگیری در حال گسترش می باشد و بدون استفاده از الگوریتم های داده کاوی و مدلهای کلان داده، بهره برداری از این داده ها امکان پذیر نخواهد بود. مطالعات گذشته بیانگر امکان پیش بینی قیمت سهام توسط مدل های یادگیری ماشین می باشد؛ اما دقت پیش بینی این مدل ها مورد ارزیابی قرار نگرفته است. هدف از این پژوهش مقایسه دقت هوشمندی پنج الگوریتم پرکاربرد داده کاوی شامل شبکه عصبی، رگرسیون لجستیک، نزدیکترین همسایه k، ماشین بردار پشتیبان و اعتبارسنجی ضربدری می باشد. از بین 385 شرکت فعال در بورس اوراق بهادار تهران، 72 شرکت به روش حذف سیستماتیک انتخاب و دقت مدل های فوق برای پیش بینی قیمت سهام بر روی داده های روزانه سهام منتحب برای سال های 1388 تا 1399 پیاده سازی شده است. متغیر قیمت سهام به عنوان متغیر وابسته و متغیرهای قیمت باز شدن، قیمت بسته شدن، بالاترین قیمت، پایین ترین قیمت و حجم معاملات، قیمت روزانه ارز آزاد، قیمت طلا و قیمت نفت به عنوان متغیر مستقل استفاده شده است. برای ارزیابی دقت برآورد قیمت سهام از سه شاخص ، MSE و RMSE استفاده شده و از تحلیل واریانس با استفاده از آماره F برای برازش دقت مدل ها و از آماره t برای مقایسه دو به دو مدل ها با یکدیگر استفاده شده است. نتایج پژوهش نشان داد از بین الگوریتم های هوشمند استفاده شده، الگوریتم ماشین بردار پشتیبان بیشترین قدرت برآورد قیمت سهام را به خود اختصاص داده است

Comparison of Intelligence Accuracy of Data Mining Algorithms to Estimate Stocks Prices

Forecasting the stock price due to its attractiveness has always been on the focus of experts and capital market activists. In such a way that various prediction models such as technical and fundamental analysis and data mining are increasingly used to predict stock prices. Past studies indicate the possibility of stock price prediction by machine learning models, but the prediction accuracy of these models has not been evaluated. The purpose of this research is to accurately compare the intelligence of five commonly used data mining algorithms, including neural network, Logestic regression, k-nearest neighbors, support vector machines and cross validation. Among the 385 active companies in Tehran Stock Exchange, 72 companies have been selected by the method of systematic elimination and the above models have been implemented to predict stock prices on the daily prices of selected stocks for the years 2009 to 2020. The stock price is used as a dependent variable and changes in the opening price, closing price, highest price, lowest price and volume of trade, daily price of forign currency, gold and oil price are used as independent variables. Three indicators R2, MSE and RMSE are used, to evaluate the accuracy of models, and analysis of variance using F statistics is used to fit the accuracy of the models, and t-student statistic is used to compare two models. The results are showed that among the smart algorithms used, the support vector machine algorithm has the highest accuracy. Matlab software is used to analyze the data and compare the models.

تبلیغات