Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/12035
Title: Elektrikli Otobüslerde Çizge Tabanlı Öznitelik Seçimi ve Makine Öğrenmesi ile Kestirimci Bakım
Other Titles: Predictive Maintanance With Graph Based Feature Selection & Machine Learning in Electrical Busses
Authors: Erçevik, Ayşe Irmak
Advisors: Özbayoğlu, Ahmet Murat
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Abstract: Bu tez çalışmasında, elektrikli otobüslere ait CAN (Controller Area Network) Bus verileri kullanılarak çizge tabanlı öznitelik seçim yöntemi ile sistemin özellikleri arasındaki ilişkiler analiz edilmiş ve üretici tarafından hedeflenen alarmların yapay zekâ teknikleri ile kestirim performansı araştırılmıştır. Araştırmada belli bir süre boyunca, farklı araçlardan elde edilen CAN Bus verileri kullanılmıştır. Ham veri paketleri üzerinde kapsamlı ön işleme teknikleri uygulanmış ve makine öğrenmesi modellerinin yapısal ihtiyaçlarına uygun veri setleri oluşturulmaya gayret edilmiştir. Bu süreçte Pearson korelasyon analizi, Cramer's V istatistik tablosu ve Anova F-testi gibi istatiksel filtreleme yöntemleri ve InfoMap, Leiden, Louvain, Fast Greedy gibi optimizasyon tabanlı topluluk tespiti algoritmaları kullanılarak, hibrit çizge tabanlı öznitelik seçim aracı geliştirilmiştir. Geliştirilen araç kullanılarak özellik altkümeleri belirlenmiş, özelliklerin ilişkisel konumu ve hedeflenen alarmlarla ilişkileri değerlendirilerek ayırt edici öznitelikler seçilerek boyut azaltımı yapılmıştır. Makine öğrenmesi modellerinin seçilmesinde, Destek Vektör Makinesi (SVM), Rastgele Orman (RF), eXtreme Gradient Boosting (XGBoost), Uzun Kısa Süreli Bellek (LSTM), ve Tekrarlayan Sinir Ağları (RNN) modelleri dahil olmak üzere sinir ağı mimarileri ve geleneksel sınıflandırıcılar uygulanarak performansları değerlendirilmiştir. Sınıf dengesizliğinin modellerin performansındaki etkisini minimize etmek için SMOTEEN (Synthetic Minority Oversampling Technique-Edited Nearest Neighbours) ve ikili arama tabanlı zaman aralığı örnekleme (binary search based time interval down-sampling) yöntemleri uygulanmıştır. Her modelin en iyi ayırt edici sınıflandırıcı uzayını bulmak için Izgara Arama (Grid Search) ve Rastgele Arama (Random Search) tabanlı hiperparametre optimizasyonu (Hyperparameter tuning) yapılmıştır. Geliştirilen modellerin performansları geçerleme (validation) metrikleri esas alınarak değerlendirilmiştir. Modellerin kestirimleri özniteliklerin ağırlıkları incelenerek ve LIME (Local Interpretable Model-Agnostic Explanations) aracı kullanılarak açıklanmaya çalışılmış, kestirimleri tetikleyen öznitelikler belirlenmiş ve sistemin işleyişi (tasarımı) ile ilgili içgörüler elde edilmiştir. Bu çalışma kapsamında CAN Bus verileri kullanılarak araçlardaki belli alarmların makine öğrenmesi teknikleri ile kestirim performansı araştırılmış, çizge tabanlı bir öznitelik seçme aracı geliştirilerek düzeltici, önleyici, kestirimci ve proaktif bakım (tasarımın iyileştirilmesi) yaklaşımlarının iyileştirilmesine yardımcı olacak şekilde öznitelikler arasındaki ilişkilerin görsel olarak yorumlanması imkânı sağlanmıştır. Çalışmada izlenen makine öğrenmesi yaşam döngüsü kapsamında uygulanan tekniklerin farklı sektörlerde ve Endüstri 4.0 gereği bakım stratejilerinin makine öğrenimi yoluyla iyileştirilmesinde, özellikle veri kalitesi ve uzman görüşüne erişim zorluğu olan projelerde yararlı olabileceği değerlendirilmektedir. Anahtar Kelimeler: Kestirimci bakım (PdM), Makine öğrenimi (ML), Çizge tabanlı öznitelik seçimi, Açıklanabilir yapay zekâ (XAI).
This thesis employs a graph-based feature selection method to analyse the relationships between the characteristics of a CAN (Controller Area Network) Bus data set pertaining to electric buses. Furthermore, it investigates the prediction performance of targeted alarms utilising artificial intelligence techniques. The study employed data obtained from CAN Bus systems of diverse vehicles over an extended period. The raw data packages underwent extensive pre-processing techniques to create data sets suitable for the structural needs of machine learning models. In this process, a hybrid graph-based feature selection tool was developed using a combination of statistical filtering methods, including Pearson correlation analysis, Cramer's V statistical table and ANOVA F-test, and optimisation-based community detection algorithms, such as InfoMap, Leiden, Louvain and Fast Greedy. The developed tool was employed to identify feature subsets, evaluate the relational position of the features and their relationship with the targeted alarms, select distinctive features and perform dimension reduction. In the selection of machine learning models, a number of different approaches were considered, including neural network architectures and traditional classifiers. Amongst these, the Support Vector Machine (SVM), Random Forest (RF), eXtreme Gradient Boosting (XGBoost), Long Short-Term Memory (LSTM), and Recurrent Neural Network (RNN) models were applied, and their performance was then evaluated. In order to mitigate the impact of class imbalance on model performance, SMOTEEN (Synthetic Minority Oversampling Technique-Edited Nearest Neighbours) and binary search-based time interval down-sampling methods were employed. In order to identify the optimal distinctive classifier space for each model, a grid search and random search-based hyperparameter optimisation (hyperparameter tuning) was conducted. The performance of the developed models was evaluated based on the metrics employed for model validation. The predictions of the models were explained by examining the weights (importance) of the features and utilising the LIME (Local Interpretable Model-Agnostic Explanations) tool to identify the features that triggered the predictions, thereby gaining insights into the functionality (design) of the system. The present study has investigated the prediction performance of specific alarms in vehicles utilising CAN Bus data with machine learning techniques. Additionally, a graph-based feature selection tool has been developed, enabling the visual interpretation of relationships between features and facilitating the enhancement of corrective, preventive, predictive and proactive maintenance (design improvement) approaches. It is concluded that the techniques employed throughout the machine learning life cycle, as conducted in the study, can provide valuable insights and contribute to the advancement of maintenance strategies through machine learning, particularly in contexts where data quality and access to expert opinion may present challenges, in alignment with the principles of Industry 4.0. Keywords: Predictive maintenance (PdM), Machine learning (ML), Graph based feature selection, Explainable artificial intelligence (XAI).
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=LY6e5xGA7WWUpEdrBmEPLoB3AKtzFIadjy4z-SjpZ8GyNvmgRmvKKDdoQe-0QAfY
https://hdl.handle.net/20.500.11851/12035
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses

Show full item record



CORE Recommender

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.