ارائه یک مدل تشخیص دیابت مبتنی بر شبکه های عصبی عمیق بازگشتی و الگوریتم بیش نمونه گیری
آرشیو
چکیده
دیابت، به گروهی از اختلالات متابولیکی گفته می شود که نتیجه عدم کنترل قند خون است. تشخیص به موقع و در ادامه کنترل این بیماری به خوبی باعث کاهش اثرات ناشی از آن مثل رتینوپاتی دیابتی، گرفتگی قلبی و عروقی سکته های مغزی و غیره می شود. محققان تا به امروز تلاش های بسیاری در این زمینه کرده اند؛ اما اغلب این مدل ها یا مبتنی بر روش های یادگیری ماشین ساده و یا بر این فرض استوار هستند که داده های دیابت در دسترس متوازن هستند. از اینرو، در این مقاله یک مدل تشخیص بیماری دیابت مبتنی بر شبکه های عصبی بازگشتی عمیق و الگوریتم بیش نمونه گیری SMOTE ارائه شده است. در این مدل چندین مرحله پیش پردازش شامل مقدار دهی به مقادیر از دست رفته، حذف داده های پرت و سپس بیش نمونه گیری انجام شده است. از سه شبکه عصبی عمیق بازگشتی با سه واحد پنهان بازگشتی شامل LSTM, GRU و BiLSTM برای تشخیص استفاده شده است. نتایج مدل ارائه شده بر روی پایگاه داده Pima حاکی از آن است که میانگین صحت در 10 اجرای مختلف در LSTM و GRU و BiLSTM به ترتیب 91.21 % ، 89.61 و 90.99 % است. نتایج مدل بازگشتی ما نشان می دهد، شبکه های عصبی عمیق در مقایسه با روش های یادگیری ماشین عملکرد بسیار موفق تری دارند.Presenting a Diabetes Diagnosis Model Based on Recurrent Deep Neural Networks and Oversampling algorithm
Diabetes is a group of metabolic disorders that are the result of untreated high blood glucose greatly. Early diagnosis and continued control of this disease can reduce its effectsTherefore, providing a method for timely diagnosis of this disease is of great importance. Until now, researchers have made many efforts to provide machine learning methods to diagnose diabetes. But most of these models are either based on simple machine learning methods or based on the assumption that the available diabetes data are balanced. Both cases are factors of their complete failure. Therefore, considering the existing challenges as well as the importance of timely diagnosis of diabetes, in this research, a diabetes diagnosis model based on deep recurrent neural networks and SMOTE oversampling algorithm is presented. In this model, several pre-processing steps including quantification of missing values, removal of outlier data and then oversampling have been performed. Three deep recurrent neural networks with three recurrent hidden units including LSTM, GRU and BiLSTM have been used to diagnose diabetes. The results of the model presented on the Pima database received from the UCI repository indicate that the average accuracy in 10 different runs in LSTM, GRU and BiLSTM is 91.21%, 89.61% and 90.99%, respectively. The recurrent network with GRU unit has achieved the highest accuracy of 93.74% on average in 10 different executions. The results of the proposed model show that deep neural networks have a much more successful performance in diabetes diagnosis compared to traditional machine learning methods.