مقایسه دقت الگوریتم های یادگیری آماری در پیش بینی جهت حرکت قیمت سهام شرکت بیمه سامان به عنوان یک شرکت بیمه بورسی (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
پیشینه و اهداف: یکی از معیارهای تصمیم گیری برای سرمایه گذاری در یک شرکت بورسی، میزان یا تغییرات قیمت سهام آن شرکت در روزها و ماه های آتی است. روش های متعددی برای پیش بینی قیمت سهام و ریسک سرمایه گذاری در یک شرکت، مورد مطالعه قرار گرفته است. در اکثر این روش ها، قیمت سهام به عنوان یک متغیر پاسخ پیوسته پیش بینی شده است. برای این منظور، از مدل های سری زمانی استفاده می شود که در آنها پذیره هایی ازجمله نرمال بودن اغتشاش ها و یا خطی بودن مدل اهمیت دارد. هدف از این پژوهش، معرفی یک متغیر پاسخ دو رده ای براساس جهت حرکت قیمت سهم در روز آتی و معرفی چند روش رده بندی آماری برای پیش بینی آن است. این مدل ها، محدودیت های مدل های گذشته را ندارند و به همین دلیل مورد توجه هستند. پیاده سازی روش های مورد مطالعه و مقایسه دقت آنها در پیش بینی جهت حرکت قیمت سهام شرکت های بیمه بورسی هدف اصلی این مقاله است. روش شناسی: در پژوهش حاضر با استفاده از الگوریتم های K-نزدیک ترین همسایه ها، درخت تصمیم و جنگل تصادفی که در زمره روش های ناپارامتری رده بندی یادگیری آماری می باشند، به پیش بینی جهت حرکت قیمت سهام پرداخته ایم. داده های مورد استفاده در این تحقیق شامل اطلاعات قیمت سهام یکی از شرکت های بیمه در طی سال های 1390 تا 1400 است که سهم مناسب و بالایی در پرتفوی صنعت بیمه دارد. برای تعیین دقت مدل های مورد مطالعه، داده ها به صورت تصادفی به دو دسته آموزشی و آزمایشی تقسیم شدند. سپس مدل های یادگیری آماری روی داده های آموزشی اجرا و اعتبار آنها با استفاده از داده های آزمایشی سنجیده شد. یافته ها : نتایج تحقیق حاکی از دقت بالای هر سه مدل ناپارامتری در پیش بینی رده قیمت سهام شرکت بیمه مورد نظر است. همچنین در بین مدل های مورد مطالعه، الگوریتم K-نزدیک ترین همسایه ها نسبت به سایر الگوریتم ها در پیش بینی جهت حرکت قیمت سهام عملکرد بهتری از خود نشان داد. نتیجه گیری: با توجه به اهمیت ریسک سرمایه گذاری در یک شرکت بیمه برای مشتریان، یافتن مدل مناسب برای رده بندی قیمت سهام و مشخص نمودن متغیرهای مؤثر در افزایش یا کاهش قیمت، می تواند به مشتریان و شرکت های بیمه در تصمیم گیری بهتر کمک کند.Comparison of the accuracy of statistical learning algorithms in predicting of the stock price movement of Saman Insurance Company as a listed insurance company
BACKGROUND AND OBJECTIVES: One of the criteria for deciding to invest in a listed company is the amount or changes in the stock price of the company in the future days and months. Various methods have been studied to predict the stock price and investment risk in a company. In most of these methods, the stock price is predicted as a continuous response variable. For this purpose, time series models are used in which assumptions such as the normality of disturbances or the linearity of the model are important. The purpose of this research is to introduce a two-category response variable based on the direction of share price movement in the next day and to introduce some statistical classification methods to predict it. These models do not have the limitations of the previous models, and for that reason they are of interest. The main objective of this article is to implement the studied methods and compare their accuracy in predicting the orientation of stock price movement of stock exchange insurance companies. Methodology: In the current research, we have predicted the direction of stock price movement by using K-nearest neighbors, decision tree and random forest algorithms, which are among the non-parametric classification methods of statistical learning. The data used in this research includes information on the stock price of one of the insurance companies during the years 2019 to 2020, which has a suitable and high share in the portfolio of the insurance industry. To determine the accuracy of the studied models, the data were randomly divided into two groups, training and testing. Then, the statistical learning models were implemented on training data and their validity was measured using experimental data. FINDINGS: The research results indicate the high accuracy of all three non-parametric models in predicting the stock price category of the insurance company. Likewise, among the studied models, the K-nearest neighbors algorithm performed better than other algorithms in predicting the direction of stock price movement. CONCLUSION: Considering the importance of the risk of investing in an insurance company for customers, attainment to a valid model for stock price classification and specifying the variables that increase or decrease the price can help customers and insurance companies make better decisions.