Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.11851/2290
Title: | Kimyasal Moleküllerin Eşlenmesi için Çizge Temelli Örüntü Tanıma Kullanımı | Other Titles: | A Graph-Based Pattern Recognition for Chemical Molecule Matching | Authors: | Gökçer, Yunus | Advisors: | Demirci, Muhammed Fatih Tan, Mehmet |
Keywords: | Chemical molecule matching Classification Graph matching Pattern recognition Bioinformatics Kimyasal molekül eşleme Sınıflandırma Çizgi eşleme Örüntü tanıma Biyoenformatik |
Publisher: | TOBB University of Economics and Technology,Graduate School of Engineering and Science TOBB ETÜ Fen Bilimleri Enstitüsü |
Source: | Gökçer, Y. (2015). Kimyasal moleküllerin eşlenmesi için çizge temelli örüntü tanıma kullanımı. Ankara: TOBB ETÜ Fen Bilimleri Enstitüsü. [Yayınlanmamış yüksek lisans tezi] | Abstract: | Veri gösterimlerinin sınıflandırılmasında kullanılan örüntü tanıma teknikleri biyoenformatik ve kemoenformatik alanlarının önemli bileşenleri olarak görülürler. Kimyasal moleküllerin aktivitelerinin sonuçlarını tahmin edebilmek, laboratuvar ortamında deneyler yaparak elde edilen sonuçlara harcanan zaman ve maliyeti önemli oranda azaltmaya yardımcı olabilir. Bu çalışmada kimyasal moleküller arasındaki benzerlik oranlarını hesaplamaya odaklı bir çizge temelli örüntü tanıma metodunun kullanımı işlenmektedir. Bu metot, kimyasal moleküllerin kanserojenlik oranlarının tahmininde kullanılmaktadır. Kullanılan yöntemde moleküller kenar ağırlıklı çizgeler olarak, her atom bir düğüme karşılık gelecek şekilde ve atomların aralarında oluşturdukları bağlar da kenarlara karşılık gelecek şekilde tasvir edilmektedir. Uygulamada çizge gömme işlemi düğümlerin geometrik uzayda noktalar olarak temsil edilmesiyle gerçekleştirilir. Uzayda temsil edilen noktalar arasındaki benzerlik ölçüsü (uzaklığı) Earth Mover's Distance (EMD) metodu kullanılarak hesaplanır, öyle ki, bu metot dağıtım odaklı taşınım algoritması üzerine temellendirilmiştir. Bu çalışmada kullanılan metot Predictive Toxicology Challenge (PTC) veri seti üzerinde varolan metotlarla karşılaştırıldığında umut verici sonuçlar vermektedir. Pattern recognition techniques that are used for classification of data representations are important components of bioinformatics and chemical informatics. Prediction of the activity of chemical molecules is a significant process that can help saving time and cost devoted to conduct the actual experiments in the laboratory. We present a new method that uses graph-based pattern recognition to compute the similarity between chemical molecules. Our method is used for prediction of the activity of chemical molecules, that is, the prediction of carcinogenicity of molecules. In our method, molecules are depicted as edge-weighted graphs, where each atom corresponds to a vertex and the bonds between the atoms are depicted as edges. The framework performs graph embedding by representing vertices as points in a geometric space. The similarity measure (distance) between the embedded points is computed using the Earth Mover's Distance (EMD) method, which is based on a distribution-based transportation algorithm. Our method shows promising results on the Predictive Toxicology Challenge (PTC) dataset compared to the existing kernels. |
URI: | https://hdl.handle.net/20.500.11851/2290 https://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp |
Appears in Collections: | Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
409938.pdf | 1.74 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
76
checked on Dec 23, 2024
Download(s)
48
checked on Dec 23, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.