پیش بینی خسارت با استفاده از تکنیک های رگرسیون عمیق متوالی در روش های یادگیری عمیق (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
پیشینه و اهداف: یکی از چالش های مهم شرکت های بیمه تعیین نرخ بهینه بیمه نامه های اموال مانند خودرو و آتش سوزی است. اگر شرکت بیمه بتواند امکان وقوع خسارت را در یک بیمه نامه تشخیص دهد، تصمیمات مؤثر و بهتری در تعیین نرخ بیمه ، میزان تخفیف اختصاص یافته به بیمه نامه یا تصمیم گیری درباره تمدید آن بیمه نامه خواهد داشت. شرکت های بیمه و خبرگان رشته صدور و خسارت ، به دنبال روش های جدیدی برای ارزیابی ریسک مشتریان و بیمه نامه ها از طریق پیش بینی وقوع خسارات احتمالی در این رشته هستند. روش های سنتی مانند مدل های خطی عمومی (GLMs) غالباً در شناسایی الگوهای پیچیده در داده های بیمه ناکام اند. یادگیری عمیق با توانایی شناسایی روابط غیرخطی و الگوهای پیچیده می تواند این محدودیت ها را رفع کند. در این مقاله روشی برای بهبود عملکرد یادگیری عمیق با استفاده از تکنیک های رگرسیون عمیق ترتیبی ارائه شده است. رویکرد پیشنهادی ترکیبی از یادگیری عمیق و مدل های ترتیبی است. از شبکه های حافظه طولانی کوتاه مدت (LSTM) برای مدل سازی داده های سری زمانی استفاده می شود. روش شناسی: در این مقاله از داده های 7 سال اخیر صدور و خسارت بیمه آتش سوزی شرکت بیمه البرز برای بررسی و پیش بینی خسارت در این رشته استفاده شده است. در این مقاله با تمرکز بر پیش پردازش داده ها و استخراج ویژگی های برتر برای ارائه بهترین نتیجه و پس از اعمال روش های مختلف استخراج ویژگی، در نهایت از مجموع 40 ویژگی، 20 ویژگی انتخاب و سپس با استفاده یادگیری عمیق آموزش داده شد. رویکرد پیشنهادی، ترکیبی از یادگیری عمیق و مدل های ترتیبی با استفاده از شبکه های حافظه طولانی کوتاه مدت (LSTM) برای مدل سازی داده های سری زمانی استفاده می کند. یافته ها : در این مقاله با بررسی روش های مختلف یادگیری ماشینی روی داده های صدور و خسارت شرکت بیمه ، این نتیجه به دست آمد که مدل رگرسیون عمیق ترتیبی نسبت به روش های سنتی عملکرد بهتری دارد. بهبود دقت پیش بینی، قابلیت اطمینان بالاتر و تأکید بر اهمیت ویژگی های زمانی از نتایج اصلی اند. نتیجه گیری: بهینه سازی فرایندهای ارزیابی ریسک و خسارت از طریق مدل های یادگیری عمیق می تواند به ارائه نرخ های حق بیمه دقیق تر و کاهش ضررهای ناشی از پرداخت های نامناسب منجر شود. همچنین، استفاده از این مدل ها می تواند به شرکت های بیمه کمک کند تا استراتژی های مدیریت ریسک بهتری اتخاذ کنند و فرایندهای کشف تقلب را بهبود بخشند. این موضوع به ویژه در بیمه های آتش سوزی، که خسارت های مالی سنگینی به همراه دارند، از اهمیت بالایی برخوردار است.Predicting damage using sequential deep regression techniques in deep learning methods
BACKGROUND AND OBJECTIVES: The role of the insurance industry is changing nowadays. The reason is that companies are using new analytical methods to predict losses and risks, and these methods help them assess potential risks. In this era, traditional business models and old methods have always been under threat from technology. New insurance companies are using the power of innovative technologies to eliminate the traditional leaders of the insurance market. The protection provided to the insured against risks and the proposed solutions provided to deal with risks are obtained through services designed to identify potential risks, and these services can be used to warn of danger (in high-risk cases). As a result, these services will be the most important distinction of these companies and the key to their success in the future. Powerful artificial intelligence and analysis of large volumes of big data give insurers the power to move towards predicting losses and incidents. The more information insurance companies have about their policyholders, the better they can use these valuable data to predict policyholders’ behavior and create a historical profile for each individual, thereby reducing the volume of claims and associated risks. Insurance companies enjoying leverage innovative technologies have a significant opportunity for growth. However, those that continue to rely on basic questions such as age, gender, and occupation to determine premiums are unlikely to survive in the digital era and amidst the rise of insurtech. Insurers that fail to adopt predictive analytics and continue to use outdated traditional systems may experience longer delays in processing and paying claims compared to innovative companies. This gap will allow tech-driven insurers to attract more customers and cover a wider range of policyholders in the long term. Insurance data often contains nonlinear and complex relationships that simple models—such as linear regression or decision trees—cannot fully capture or model effectively. These companies are also faced with vast volumes of data. Traditional methods such as general linear models often fail to identify complex patterns in insurance data. Therefore, we seek to improve existing methods by applying modern techniques such as deep learning , since deep neural networks can more accurately identify complex patterns in insurance data, process large datasets efficiently, and uncover hidden insights. Deep learning, with the ability to identify nonlinear relationships and complex patterns, can overcome these limitations. In this paper, a method to improve the performance of deep learning using sequential deep regression techniques is presented. The proposed approach is a combination of deep learning and sequential models. Long Short-Term Memory (LSTM) neural networks are used to model time series data. METHODS: In this study, data spanning the past seven years from Alborz Insurance Company—specifically related to the issuance and loss records of fire insurance policies—has been systematically utilized to analyze and forecast potential losses in this domain. The methodology places a strong emphasis on comprehensive data pre-processing, including cleaning, normalization, and transformation to ensure the reliability and quality of the input data. In the feature engineering stage, various techniques were applied to extract the most informative and relevant attributes from the raw dataset. Out of a total of 40 initially selected features, the top 20 features were identified through statistical analysis and machine learning-based selection methods. These refined features were then used to train the deep learning models. The proposed method is a hybrid approach that combines deep learning with sequential modeling techniques. Specifically, Long Short-Term Memory (LSTM) neural networks were employed due to their ability to capture time-dependent patterns in sequential data, making them particularly suitable for modeling the temporal dynamics inherent in insurance data over multiple years. FINDINGS : The study involved the evaluation and comparison of multiple machine learning algorithms, including traditional models and advanced deep learning techniques. The results demonstrated that the proposed sequential deep regression approach significantly outperforms conventional models such as general linear models and decision trees. Notably, the LSTM-based model provided higher prediction accuracy and demonstrated superior performance in identifying complex, nonlinear patterns within the data. Key findings highlight the critical role of temporal features in enhancing prediction reliability and show that incorporating time series analysis is essential for improving the accuracy of damage occurrence forecasts in fire insurance. CONCLUSION: The results of this research underscore the effectiveness of combining deep learning techniques with sequential models for predicting fire insurance losses. Using the confidential and comprehensive issuance and claims dataset from Alborz Insurance Company over seven years, the proposed hybrid model was capable of delivering better performance in comparison to previous methods. The approach not only improved the precision of predictions but also offered a more robust and scalable solution for risk assessment. Overall, the use of LSTM-based deep learning models represents a significant advancement in the insurance industry’s ability to make data-driven decisions regarding premium setting, policy issuance, and risk mitigation strategies.








