Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/10638
Title: Meme kanserinin gelistirilmis makine ögrenme yöntemleri ile tespiti
Other Titles: Detection of breast cancer with improved machine learning algorithms
Authors: Akkur, Erkan
Advisors: Eroğul, Osman
Keywords: Biyomühendislik
Bioengineering ; Mühendislik Bilimleri
Engineering Sciences
Bilgisayar destekli teşhis
Computer assisted diagnosis ; Makine öğrenmesi
Machine learning ; Meme kanseri
; Yapay zeka
Artificial intelligence
Publisher: TOBB ETÜ
Abstract: Meme kanseri dünya genelinde kadınlar arasında en sık görülen kanser türüdür. Meme kanseri erken evrede teşhis edilirse, tedavi edilmesi mümkündür. Bu çalışma meme kanserinin tanısı için geliştirilmiş makine öğrenme algoritmalarına dayalı yeni bir sınıflandırma sistemi önermektedir. Geliştirilmiş makine öğrenme algoritmaları oluşturmak amacıyla öznitelik seçim ve hiperparametre optimizasyon yöntemleri kullanılmıştır. Makine öğrenme algoritması olarak sırasıyla Karar Ağacı, Naive Bayes, Destek Vektör Makinesi, K-En Yakın Komşu ve Topluluk Öğrenme yöntemleri kullanılmıştır. Tüm deneyler Wisconsin Meme Kanseri Veri (WBCD) seti ve Mamografi Meme Kanseri Veri Seti (MBCD) olmak üzere iki farklı meme kanseri veri seti üzerinde test edilmiştir. Veri setlerinin en ayırt edici özniteliklerini belirlemek amacıyla sırasıyla Relief, En Küçük Mutlak Daralma ve Seçme Operatörü ((Least Absolute Deviation and Least Absolute Shrinkage and Selection Operator-LASSO) ve Ardışık İleri Yönde Seçim yöntemleri kullanılmıştır. Makine öğrenme algoritmalarındaki en uygun hiperparametreleri bulmak için Bayes optimizasyon (BO) yöntemi kullanılmıştır. Çalışma kapsamında en iyi sınıflandırma oranını elde etmek amacıyla farklı deneyler yapılmıştır. Önerilen öznitelik seçim-Bayes optimizasyon hibrit yöntemleri çalışmada kullanılan makine öğrenme algoritmalarının sınıflandırma oranlarını artırmıştır. Yapılan deneyler sonucunda, LASSO-BO-DVM yöntemi her iki meme kanseri veri setinde de en yüksek doğruluk, kesinlik, duyarlılık ve F1-skorunu göstermiştir (WBCD için %98,95, %97,17, %100 ve %98,56; MBCD için %97,95, %98,28, %98,28 ve %98,28).
Breast cancer is the most common cancer type among women worldwide. If breast cancer is detected at an early stage, it can be cured. This study proposes a novel classification model based improved machine learning algorithms for diagnosis of breast cancer. Feature selection and hyperparameter optimization methods are used to build improved the machine learning algorithms. Decision Tree, Naive Bayes, Support Vector Machine, K-Nearest Neighbor and Essemble Learning methods are used as machine learning algorithms, respectively. All experiments are tested on two different datasets, Wisconsin Breast Cancer Dataset (WBCD) and Mammographic Breast Cancer Dataset (MBCD). Relief, Least Absolute Deviation and Least Absolute Shrinkage and Selection Operator (LASSO) and Sequential Forward Selection methods are used to determine the most distinctive features of the datasets, respectively. Bayesian optimization (BO) method is used to find optimal hyperparameters in machine learning algorithms. Within the scope of this study, different experiments are conducted in order to obtain the best classification rate. The proposed feature selection-Bayes optimization hybrid methods have increased the classification rates of the machine learning algorithms used in the study. As a result of the experiments, LASSO-BO-SVM has showed the highest accuracy, precision, recall and F1-score in both datasets (%98,95, %97,17, %100, %98,56 for WBCD; %97.95, %98,28, %98,28, %98,28 for MBCD).
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=G_oJ1rKE4SgJUkomyAKpR9XwMIPTTkJKbISTtSwDgeflpgQpts59kZA9hB2q0s4a
https://hdl.handle.net/20.500.11851/10638
Appears in Collections:Biyomedikal Mühendisliği Doktora Tezleri / Biomedical Engineering PhD Theses

Show full item record



CORE Recommender

Page view(s)

110
checked on Apr 29, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.