Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/921
Title: Ağırlıklı çoklu sınıflandırıcı kullanarak biyolojik verilerin tahmini
Other Titles: Prediction of biological data by using weighted ensemble classifiers
Authors: Özyer, Tansel
İyidoğan, Taylan
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Issue Date: 2013
Publisher: TOBB Ekonomi ve Teknoloji Üniversitesi Fen Bilimleri Enstitüsü
Source: İyidoğan, T.(2013).Ağırlıklı çoklu sınıflandırıcı kullanarak biyolojik verilerin tahmini .Ankara:TOBB ETÜ Fen Bilimleri Enstitüsü.[Yayınlanmamış Yüksek Lisans Tezi]
Abstract: Nowadays, cancer disease is rapidly spreading and it is difficult to treat. There are different types of cancer such as breast, lung, central nervous system, leukemia and many more. Each type consists of different sequence error in the gene syntax in the body. In order to treat them, early diagnosis is mandatory, It means that gene sequences must be interpreted in a smart and accurate way. Genome wide scale data classification has been triggered by the microarray technologies. A DNA microarray can have different expression levels of genes simultaneously. Past studies indicate that microarray technology can provide means for tumor classification. Related datasets contain small number of samples; the number of genes is extremely larger than the number of samples and these make knowledge discovery challenging in microarray. For this reason, different classification methods were proposed. However, classifiers' performance results may be dataset dependent. While the classification accuracy of one classifier can make high accuracy for some dataset, it may give poor accuracy for another. That means, there is no perfect classifier works for all datasets robustly. Regardless of selecting one classification approach, ensemble classifiers approach is proposed. It combines each individual classifier prediction in the pool to create joint decision-rules and classify unknown samples according to this decision rules. Ensemble classifiers is being used in many image processing, artificial intelligence and medical fields as well. In this thesis, I worked on creating an ensemble classifiers method that chooses best classifier combination in the classifier pool. I focused on twenty nine different classifiers in literature to selection each having different weights based on their past performance. A two level genetic algorithm is used to create ensemble classifiers. In this proposed method, the first level determines the classifiers to use; the second level optimizes their weights for effectiveness. The results of this study are promising when compared to other methods.
Kanser, günümüzde çok yaygın olarak rastlanılan tedavisi zor olan bir hastalıktır. Göğüs kanseri, akciğer kanseri, merkezi sinir sistemi kanseri ve lösemi başta olmak üzere birçok çeşidi bulunmaktadır. Bunlar, vücuttaki farklı gen dizilimlerindeki hatalardan dolayı oluşmaktadır. Bu hastalık türlerinin tedavi edilebilmeleri için erken teşhis önemlidir. Başka bir deyişle, genler dizilimlerinin doğru anlamlandırılması anlamına gelmektedir. Günümüzde mikro çip teknolojisi ile geniş çaplı gen sınıflandırılması mümkündür. DNA mikroçip, aynı anda, farklı seviyelerde genlerin durumlarını sunar. Geçmiş çalışmalar, mikroçip teknolojisinin tümör sınıflandırmasında da çok etkili olduğunu göstermektedir. İlgili veri setleri fazla özniteliğe sahip olmalarına rağmen, az örnek bulundururlar. Geçmiş yıllarda, farklı sınıflandırıcı yöntemleri geliştirilmiştir. Yöntemler, veri setlerine bağımlı olarak farklı doğruluk oranlarına sahip olabilirler. Bu da bir sınıflandırıcının, bütün veri setlerinde aynı etkinlikte çalışamayacağı anlamına gelmektedir. Bir veri seti için; birden çok sınıflandırıcı kullanıp bir topluluk oluşturarak, sınıflandırıcı doğruluğunu arttırmak ve yanlış sınıflandırıcı seçme olasılığını azaltmak hedeflenmiştir. Yaygın kullanımda sınıflandırıcı topluluğu, birçok sınıflandırıcının bireysel performanslarına bakılarak ortak bir karar mekanizması yaratmak ve daha önce tanımlanmamış örnekleri bu karar mekanizması ile sınıflandırılması için kullanılır. Sınıflandırıcı topluluk oluşturma, sadece mikroçip veri setlerini sınıflandırmanın yanı sıra, görüntü işleme, yapay zekâ ve tıp gibi birçok alanda da kullanılmaktadır. Bu tez çalışmasında, literatürde bulunan yirmi dokuz sınıflandırıcı kullanaarak, veri setlerine özel sınıflandırıcı topluluklar oluşturulmuştur. Ayrıca oluşturulan topluluktaki her bir sınıflandırıcıya ağırlıklar atanmıştır. Bu sayede, sınıflandırmanın doğruluğunun arttırılması amaçlanmıştır. Sınıflandırıcı topluluğu oluşturmak için iki seviyeli genetik algoritma kullanılarak yeni bir metot geliştirilmiştir. İki seviyeli genetik algoritmanın ilk seviyesinde sınıflandırıcılar seçilmiş, ikinci seviyesinde ise, bu sınıflandırıcılara uygun ağırlıklar atanmıştır. Önerilen yöntem ile alınan sonuçlar, diğer yöntemlerle elde edilen sonuçlardan üstündür.
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp
https://hdl.handle.net/20.500.11851/921
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses

Files in This Item:
File Description SizeFormat 
350359.pdfTaylan İyidoğan_tez3.11 MBAdobe PDFThumbnail
View/Open
Show full item record

CORE Recommender

Page view(s)

14
checked on Dec 26, 2022

Download(s)

16
checked on Dec 26, 2022

Google ScholarTM

Check


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.