Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/914
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorAbul, Osman-
dc.contributor.authorSöylev, Arda-
dc.date.accessioned2019-04-15T13:04:08Z
dc.date.available2019-04-15T13:04:08Z
dc.date.issued2013
dc.identifier.citationSöylev, A.(2013).Biyolojik veritabanlarında etkin benzerlik hesaplama.Ankara:TOBB ETÜ Fen Bilimleri Enstitüsü.[Yayınlanmamış Yüksek Lisans Tezi]tr_TR
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp-
dc.identifier.urihttps://hdl.handle.net/20.500.11851/914-
dc.description.abstractIt is possible to explain the events occurring inside the cell, the smallest unit in living things, by observing biological networks. Similarity-based analysis is one of the techniques for biological network analysis. In this context, a database consisting of biological networks is aligned with a query network, and the networks having a similarity score higher and lower than a predefined cut-off value are separated. The exact similarity score of two networks needs to be known in the solution of this problem. Unfortunately, because of the NP-complete sub-graph isomorphism problem, this is computationally too expensive. Several methods are proposed in the literature to solve the graph alignment problem. QNET, which is one of these methods, is coded in Java using Hadoop framework in the scope of this thesis. For query networks with 7 nodes, Hadoop implementation with 10 machine cluster (18 cores) achieved 11,42 speedup. A new method called ESBiD, taking the "reference based indexing method" approach has been developed. Particularly, ESBiD focused on the weaknesses of RINQ, another reference based indexing method. To this end, by using heuristics, the number of networks in the twilight zone has been reduced by 29,85% with 93,22% accuracy, the reference network selection strategy has been changed and a new technique called "highest degree node" has been proposed in order to align the networks in the twilight zone faster. This technique reached 89,74% effectiveness in 51,14% runtime with respect to the QNET's exact alignment method.en_US
dc.description.abstractCanlının temel özelliklerini taşıyan en küçük birim olan hücrenin içerisinde meydana gelen olayların açıklanması biyolojik ağlarının incelenmesiyle mümkün olur. Bu inceleme için kullanılan tekniklerden biri benzerlik tabanlı analizdir. Bu kapsamda, bir sorgu ağıyla biyolojik ağlardan oluşan bir biyolojik veritabanı karşılaştırılmakta, sorgu ağıyla benzerliği belli bir eşik değerinin üzerinde ve aşağısında olan ağlar ayrışmaktadır. Bu problemin çözümü, iki ağın benzerliğinin bulunmasını gerektirir. Literatürde NP-tam olarak geçen alt çizge eşleniği problemi sebebiyle problemin çözümü hesaplamsal olarak çok maliyetlidir. Çözüm için literatürde çeşitli yöntemler geliştirilmiştir. Bu yöntemlerden biri olan QNET yöntemi, bu tez çalışması kapsamında Java diliyle ve Hadoop çatısında kodlanmıştır. 7 düğümlü sorgu ağları için Hadoop gerçekleştirimi 10 makinalı (18 çekirdekli) bir öbekte 11,42 hızlanma sağlamıştır. Ayrıca literatürde yer alan "referans tabanlı indeksleme yöntemi" incelenerek ESBiD yöntemi geliştirilmiş, bir referans tabanlı indeksleme yöntemi olan RINQ' nun zayıflıkları üzerine çalışmalar yapılmıştır. Bu kapsamda sezgisel yöntemler kullanılarak belirsizlik setindeki ağ sayısı %29,85 oranında, %93,22 doğruluk payıyla azaltılmış, referans ağların seçim yöntemi değiştirilmiş ve belirsizlik setinde biriken ağların daha hızlı hizalanması için "en yüksek dereceli düğüm" tekniği geliştirilmiştir. Bu teknik, QNET' le yapılan tam hizalamanın %89,76 etkinliğine %51,14 daha kısa sürede ulaşmıştır .en_US
dc.language.isotren_US
dc.publisherTOBB Ekonomi ve Teknoloji Üniversitesi Fen Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectBiyoinformatiktr_TR
dc.subjectBionformaticen_US
dc.subjectGrafiklertr_TR
dc.subjectGraphicsen_US
dc.subjectParalel hesaplamatr_TR
dc.subjectParallel computingen_US
dc.titleBiyolojik veritabanlarında etkin benzerlik hesaplamaen_US
dc.title.alternativeEffective similarity calculation in biological databasesen_US
dc.typeMaster Thesisen_US
dcterms.rightsYazarına aittir / Belongs to author
dc.departmentInstitutes, Graduate School of Engineering and Scienceen_US
dc.departmentEnstitüler, Fen Bilimleri Enstitüsütr_TR
dc.relation.publicationcategoryTezen_US
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.fulltextWith Fulltext-
item.cerifentitytypePublications-
item.openairetypeMaster Thesis-
item.languageiso639-1tr-
item.grantfulltextopen-
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses
Files in This Item:
File Description SizeFormat 
346549.pdfArda Söylev_tez7.73 MBAdobe PDFThumbnail
View/Open
Show simple item record



CORE Recommender

Page view(s)

86
checked on Nov 4, 2024

Download(s)

38
checked on Nov 4, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.