Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/2290
Title: Kimyasal Moleküllerin Eşlenmesi için Çizge Temelli Örüntü Tanıma Kullanımı
Other Titles: A Graph-Based Pattern Recognition for Chemical Molecule Matching
Authors: Gökçer, Yunus
Advisors: Demirci, Muhammed Fatih
Tan, Mehmet
Keywords: Chemical molecule matching
Classification
Graph matching
Pattern recognition
Bioinformatics
Kimyasal molekül eşleme
Sınıflandırma
Çizgi eşleme
Örüntü tanıma
Biyoenformatik
Publisher: TOBB University of Economics and Technology,Graduate School of Engineering and Science
TOBB ETÜ Fen Bilimleri Enstitüsü
Source: Gökçer, Y. (2015). Kimyasal moleküllerin eşlenmesi için çizge temelli örüntü tanıma kullanımı. Ankara: TOBB ETÜ Fen Bilimleri Enstitüsü. [Yayınlanmamış yüksek lisans tezi]
Abstract: Veri gösterimlerinin sınıflandırılmasında kullanılan örüntü tanıma teknikleri biyoenformatik ve kemoenformatik alanlarının önemli bileşenleri olarak görülürler. Kimyasal moleküllerin aktivitelerinin sonuçlarını tahmin edebilmek, laboratuvar ortamında deneyler yaparak elde edilen sonuçlara harcanan zaman ve maliyeti önemli oranda azaltmaya yardımcı olabilir. Bu çalışmada kimyasal moleküller arasındaki benzerlik oranlarını hesaplamaya odaklı bir çizge temelli örüntü tanıma metodunun kullanımı işlenmektedir. Bu metot, kimyasal moleküllerin kanserojenlik oranlarının tahmininde kullanılmaktadır. Kullanılan yöntemde moleküller kenar ağırlıklı çizgeler olarak, her atom bir düğüme karşılık gelecek şekilde ve atomların aralarında oluşturdukları bağlar da kenarlara karşılık gelecek şekilde tasvir edilmektedir. Uygulamada çizge gömme işlemi düğümlerin geometrik uzayda noktalar olarak temsil edilmesiyle gerçekleştirilir. Uzayda temsil edilen noktalar arasındaki benzerlik ölçüsü (uzaklığı) Earth Mover's Distance (EMD) metodu kullanılarak hesaplanır, öyle ki, bu metot dağıtım odaklı taşınım algoritması üzerine temellendirilmiştir. Bu çalışmada kullanılan metot Predictive Toxicology Challenge (PTC) veri seti üzerinde varolan metotlarla karşılaştırıldığında umut verici sonuçlar vermektedir.
Pattern recognition techniques that are used for classification of data representations are important components of bioinformatics and chemical informatics. Prediction of the activity of chemical molecules is a significant process that can help saving time and cost devoted to conduct the actual experiments in the laboratory. We present a new method that uses graph-based pattern recognition to compute the similarity between chemical molecules. Our method is used for prediction of the activity of chemical molecules, that is, the prediction of carcinogenicity of molecules. In our method, molecules are depicted as edge-weighted graphs, where each atom corresponds to a vertex and the bonds between the atoms are depicted as edges. The framework performs graph embedding by representing vertices as points in a geometric space. The similarity measure (distance) between the embedded points is computed using the Earth Mover's Distance (EMD) method, which is based on a distribution-based transportation algorithm. Our method shows promising results on the Predictive Toxicology Challenge (PTC) dataset compared to the existing kernels.
URI: https://hdl.handle.net/20.500.11851/2290
https://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses

Files in This Item:
File Description SizeFormat 
409938.pdf1.74 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Page view(s)

76
checked on Dec 23, 2024

Download(s)

48
checked on Dec 23, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.