Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/10074
Title: Kimyasalların gen düzenleyici etkilerinin tahmini için transfer öğrenimi
Other Titles: Transfer learning for predicting gene regulatory effects of chemicals
Authors: Maral, Bahattin Can
Advisors: Tan, Mehmet
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Doz-cevap ilişkisi-ilaç
Dose-response relationship-drug
Makine öğrenmesi
Machine learning
Publisher: TOBB ETÜ
Abstract: Kemogenomik, ilaç tasarımına ve taramaya yardımcı olmak amacıyla biyolojik hedeflerin kimyasal bileşiklere genomik ve/veya proteomik reaksiyonunun incelenmesidir. Kemogenomikteki birçok zorluktan biri, gerçek yaşam deney verilerine bağımlılıktan kaynaklanmaktadır; farklı kimyasal bileşiklerin ve ilaç hedeflerinin kombinasyonu, gerçekçi olmayan sayıda olası deney yaratır ve bu da belirli kimyasallara ve hedeflere yönelik önyargılı veri kümeleriyle sonuçlanmaktadır. Yapay öğrenmedeki son gelişmeler, bu veri kümelerinin sınırlarını kolayca zorlayan güçlü modellerin aşırı doygunluğuyla sonuçlanmıştır. Bu yatkınlıkların etkilerini nötrlemek için, benzer problemlerden bilgi edinme yöntemi olan transfer öğrenmeyi kullanmaktayız. Kemogenomik veri setlerindeki en önemli yanlılık, ilaç hedeflerine yönelik olandır. Bazı hücre dizilerinin erişebilirliği ve önemi, bu deneyler için bir ilaç hedefi olarak kullanılma şansını büyük ölçüde artırırken, diğerlerinin yapay öğrenme modellerini eğitmek için ancak yeterli verisi vardır. Derin Bileşik Profil Oluşturucu (DeepCOP) üzerinde yapılan çalışmayı temel olarak kullanırken, transfer öğreniminin, çeşitli ilaç hedeflerinin eğitilebilirliğini büyük ölçüde artırdığını deneysel olarak göstermekteyiz. Deneyler için kullanılan model yapısı değiştirilmemiştir. DeepCOP'da kullanılan veri bölme yöntemine ek olarak iki yöntem daha eklenmiştir. Deneylerimiz transfer öğrenmenin basit yöntemlerinden biri olan parametre tabanlı transfer öğrenimine odaklanırken, ROC eğrisi altında kalan alan puanlarında \%22,81'e varan ve ortalama \%9,00 iyileşme göstermiştir; bununla birlikte hiperparametre optimizasyonu uygulandığı ve transfer kaynağı olarak doğru hücre hattı seçildiğinde bu iyileşmelerin arttırılabileceğine yönelik potansiyel göstermiştir.
Chemogenomics is the study of the genomic and/or proteomic reaction of biological targets to chemical compounds, with the goal of aiding drug design and screening. One of the many difficulties in chemogenomics comes from the dependency on real-life experiment data; the combination of different chemical compounds and drug targets creates an unrealistic number of possible experiments, which results in datasets that are biased towards certain chemicals and targets. The recent developments in machine learning resulted in an over-saturation of powerful models that easily pushed the limits of these datasets. To undo the effects of these biases, we employ transfer learning, the method of leveraging knowledge from similar problems. The most important bias of chemogenomics datasets is the bias towards drug targets. The availability and significance of certain cell lines greatly increase the chance of it being used as a drug target for these experiments, while others have barely enough data to train machine learning models. We experimentally demonstrate that transfer learning greatly increases the trainability of various drug targets, while using the work done on the Deep Compound Profiler (DeepCOP) as a basis. While focused on one of the simple methods of transfer learning, our experiments showed up to 22.81\% and an average of 9.00\% improvement on the area under ROC curve scores and showed great potential to be improved upon if accompanied by hyperparameter optimization and correct cell line as the transfer source.
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=RsTBl6RWK25OBMIKtIgYYQQi9RrCRZu4cdUnbILOxmm4DPPeaonU4TuerCWIxvxB
https://hdl.handle.net/20.500.11851/10074
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses

Files in This Item:
File SizeFormat 
752640.pdf433.91 kBAdobe PDFView/Open
Show full item record



CORE Recommender

Page view(s)

162
checked on Nov 4, 2024

Download(s)

102
checked on Nov 4, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.