A Method to Classify Steel Plate Faults Based on Ensemble Learning


Creative Commons License

Özkat E. C.

Journal of Materials and Mechatronics:A (Online), vol.3, no.2, pp.240-256, 2022 (Peer-Reviewed Journal)

Abstract

With the industrial revolution 4.0, machine learning methods are widely used in all aspects of manufacturing to perform quality prediction, fault diagnosis, or maintenance. In the steel industry, it is important to precisely detect faults/defects in order to produce high-quality steel plates. However, determining the exact first-principal model between process parameters and mechanical properties is a challenging process. In addition, steel plate defects are detected through manual, costly, and less productive offline inspection in the traditional manufacturing process of steel. Therefore, it is a great necessity to enable the automatic detection of steel plate faults. To this end, this study explores the capabilities of the following three machine learning models Adaboost, Bagging, and Random Forest in detecting steel plate faults. The well-known steel plate failure dataset provided by Communication Sciences Research Centre Semeion was used in this study. The aim of many studies using this dataset is to correctly classify defects in steel plates using traditional machine learning models, ignoring the applicability of the developed models to real-world problems. Manufacturing is a dynamic process with constant adjustments and improvements. For this reason, it is necessary to establish a learning process that determines the best model based on the arrival of new information. Contrary to previous studies on the steel plate failure dataset, this article presents a systematic modelling approach that includes the normalization step in the data preparation stage to reduce the effects of outliers, the feature selection step in the dimension reduction stage to develop a machine learning model with fewer inputs, and hyperparameter optimization step in the model development stage to increase the accuracy of the machine learning model. The performances of the developed machine learning models were compared according to statistical metrics in terms of precision, recall, sensitivity, and accuracy. The results revealed that AdaBoost performed well on this dataset, achieving accuracy scores of 93.15% and 91.90% for the training and test datasets, respectively.

Endüstri devrimi 4.0 ile birlikte, makine öğrenimi yöntemlerini, kalite tahminini, arıza tespitini veya bakımını gerçekleştirmek için üretimin her alanında yaygın olarak kullanılmaktadır. Çelik endüstrisinde, yüksek kaliteli çelik levhalar üretmek için arızaları/kusurları tam olarak tespit etmek önemlidir. Ancak, süreç parametreleri ve mekanik özellikler arasındaki kesin birinci ana modeli belirlemek zorlu bir süreçtir. Ek olarak, çelik levha kusurları, çeliğin geleneksel üretim sürecinde manuel, maliyetli ve daha az üretkenlik sağlayan çevrimdışı denetim yoluyla tespit edilir. Bu nedenle, çelik plaka hatalarının otomatik olarak tespit edilmesini sağlamak büyük bir zorunluluktur. Bu amaçla, bu çalışma, aşağıdaki üç grup makine öğrenme modeli Adaboost, Bagging ve Random Forest'ın çelik levha hatalarının tespitinde yeteneklerini araştırmaktadır. Bu çalışmada İletişim Bilimleri Araştırma Merkezi Semeion tarafından sağlanan iyi bilinen çelik levha arıza veri seti kullanılmıştır. Bu veri setini kullanan birçok araştırmanın amacı, geliştirilen modellerin gerçek dünya problemlerine uygulanabilirliğini göz ardı ederek, geleneksel makine öğrenimi modellerini kullanarak çelik levhalardaki hataları doğru bir şekilde sınıflandırmaktır. Üretim dinamik bir süreçtir, sürekli ayarlamalar ve iyileştirmeler yapılır. Bu nedenle yeni bilgilere dayalı olarak en iyi modeli belirleyen yapay öğrenme süreçlerinin oluşturulması gerekmektedir. Çelik levha arıza veri seti ile ilgili önceki çalışmaların aksine, bu makale, aykırı değerlerin etkilerini azaltmak için veri hazırlama aşamasında normalleştirme adımını, kısa hesaplama süresi olan bir makine öğrenmesi modeli geliştirmek için boyut küçültme aşamasında özellik seçimi adımını ve makine öğrenmesi modelinin doğruluğunu artırmak için model geliştirme aşamasında hiperparametre optimizasyon adımını içeren sistematik bir modelleme yaklaşımı sunmaktadır. Geliştirilen makine öğrenmesi modellerinin performansları istatistiksel ölçütlere göre kesinlik, geri çağırma, duyarlılık ve doğruluk açısından karşılaştırılmıştır. Sonuçlar, eğitim ve test veri kümeleri için sırasıyla %93.15 ve %91.90 doğruluk puanlarına ulaşan AdaBoost'un bu veri setinde en iyi performansı gösterdiğini ortaya koymuştur.