چکیده

دلیل اصلی که باعث شد داده کاوی، مورد توجه صنعت اطلاعات قرار بگیرد، مسئله در دسترس بودن حجم وسیعی از داده ها و استخراج اطلاعات و دانش سودمند از آن ها است. در عملیات پاک سازی داده، مشکل کیفیت داده ها برطرف می شود. یکی از مشکلاتی که بر کیفیت داده ها تأثیر می گذارد، داده های برون هشته هستند. این نمونه ها رکوردهایی هستند که مقادیر مشخصه آن ها با رکوردهای دیگر بسیار تفاوت دارد. در این تحقیق از یک روش مبتنی بر یادگیری عمیق و شبکه عصبی عمیق 14 لایه ای بر روی پکیج تنسورفلو و کراس برای تشخیص برون هشته ای و بهبود عملکرد آن استفاده شده است. مجموعه داده مورد استفاده در این تحقیق مجموعه ای با 2 درصد برون هشته ای است. میزان صحت روش پیشنهادی مقدار 08/97 را نشان داد و معیارهای بازخوانی و دقت نیز 97 درصد محاسبه شده است. روش پیشنهادی با 5 مدل دیگر مبتنی بر شبکه عصبی کانولوشن و شبکه بازگشتی LSTM نیز مقایسه شدند. مقدار معیارهای ارزیابی کلاس بندها نشان از بهبود بسیار خوب روش پیشنهادی در مقابل روش های سنتی و حتی روش های مبتنی بر یادگیری عمیق را داده است.

Improve Anomaly Detection with Deep learning

The main reason that data mining has become the focus of attention in the information industry is the availability of large volumes of data and the urgent need to extract useful information and knowledge from this data. In data cleaning operation, the problem of data quality is solved. One of the problems that affects the quality of data is skewed data or abnormal data. These are records whose attribute values are very different from other records. In this research, a method based on deep learning and 14-layer deep neural network on the tensorflow and cross package has been used to diagnose the abnormality and improve its performance. The data set used in this research is a data set with 2% anomalies. The accuracy of the proposed method was 97.08 and the readability and accuracy criteria were 97%. The proposed method was compared with 5 other models based on convolutional neural network and LSTM recursive network. The value of the classification evaluation criteria showed a very good improvement over the proposed method compared to traditional methods and even methods based on deep learning.

تبلیغات