Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.11851/10616
Title: | Yogun bakim hastalarinin mortalite ve hastanede kalma sürelerinin derin ögrenme yöntemleri ile tahmini | Other Titles: | Prediction of mortality and length of stay of icu patients with deep learning | Authors: | Bardak, Batuhan | Advisors: | Tan, Mehmet | Keywords: | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Computer Engineering and Computer Science and Control |
Publisher: | TOBB ETÜ | Abstract: | Günümüzde dijital dönüşüm hızının artması ile beraber fiziksel olarak saklanan verilerin elektronik ortamlara aktarılması da hız kazanmıştır. Bu durum, birçok alana olduğu gibi sağlık alanına da doğrudan yansımıştır. Geçmişte fiziksel olarak saklanan hastaya ait kayıtlar bu sayede dijital ortamlara geçirilmiştir. Dijital ortama aktarılan hastaya ait demografik bilgiler, laboratuvar sonuçları, yaşamsal gözlem verileri, klinik notlar, tanı kodları ve benzeri birçok veri Elektronik Sağlık Kaydı (ESK) olarak tanımlanmaktadır. Sağlık alanındaki dijital dönüşüme ek olarak, derin öğrenme yöntemlerine olan geniş ilgi, araştırmacıları, finans, sosyal medya, siber güvenlik gibi birçok alanda yapay zeka yöntemlerini kullanmaya teşvik etmektedir. Elektronik sağlık kayıtlarının araştırmacılar için kullanılabilir hale gelmesiyle birlikte, bu veri setlerini kullanarak derin öğrenme modelleri geliştirmeye olan ilgi artmaktadır. Tez kapsamında yapılan deneylerde, günümüzdeki en popüler ve erişilebilir elektronik sağlık kayıt veri seti olan Medical Information Mart for Intensive Care (MIMIC-III) kullanılmıştır. Yoğun bakımda yatan hastaların, yaşamsal gözlem verilerini ve diğer klinik bilgilerini ölçerek, hastaların mevcut sağlık durumlarını anlamlandırmak ve gelecek sağlık durumlarını tahmin etmek önemli bir problemdir. Tez kapsamında, hastaların hastane içinde ve yoğun bakımda mortalite ihtimalleri ile yoğun bakımda 3 ve 7 günden fazla kalıp kalmayacakları çok-kipli derin öğrenme tabanlı yöntemler ile tahmin edilmiştir. Gerçekleştirilen çalışma üç ana bölüme ayrılmıştır. İlk bölümde, yoğun bakımda yatan hastalara ait yaşamsal gözlem verileri, laboratuvar sonuçları gibi özniteliklere ek olarak hastalara ait klinik notlar da model eğitimine dahil edilmiş ve modelin klinik problemleri tahmin etme başarısı arttırılmaya çalışılmıştır. İkinci bölümde, klinik notların doğrudan kullanılması yerine, varlık isim tanıma yöntemi ile notlar içerisinden medikal terimlerin çıkartılması sağlanmıştır. Elde edilen medikal terimlerin, mortalite ve yoğun bakımda kalma süresi tahmini problemlerine etkisi araştırılmıştır. Yapılan son çalışmada ise, hastaların zaman serisi özniteliklerine ilave olarak, hastaların yoğun bakımda kaldıkları süre boyunca kullandıkları ilaçların moleküler temsilleri kullanılmış ve klinik problemlerin tahminine etkisi üzerine deneyler yapılmıştır. Ek olarak, bu çalışma sonunda, hastanede mortalite tahmini için eğitilen modelin açıklanabilirliğini arttırmak amacıyla SHapley Additive exPlanations (SHAP) yöntemi kullanılmıştır. SHAP yönteminin çıktısı, zaman-serisi ve klinik ilaç özniteliklerinin model üzerindeki etkisininin daha derin bir analizinin yapılmasını sağlamaktadır. MIMIC-III veri seti içerisinde hastaya ait farklı veri türlerinin bir arada bulunması, tez kapsamında yapılan deneylerde bu veri türlerinin bir arada kullanılabilmesine ve farklı deneylerin gerçekleştirilebilmesine olanak sağlamıştır. Farklı veri türlerini aynı model içerisinde kullanabilmek için çok-kipli derin öğrenme tabanlı yöntemler önerilmiştir. Yapılan deney sonuçları incelendiğinde, zaman-serisi özniteliklerin yanı sıra hastaya ait klinik notların, medikal terimlerin ve ilaç bilgilerinin modele girdi olarak verilmesinin, klinik problemlerin başarımına olumlu yönde etki ettiği görülmüştür. The increase in the speed of digital transformation has accelerated the transfer of physically stored data to electronic media data. Healthcare is one of many areas that is impacted by these transformation. Electronic health records (EHR) is the general term for the data that is associated with a patient's whole health journey including demographic information, laboratory test results, vital signs, clinical notes, diagnosis codes, and related data. In addition to the digital transformation in healthcare, the widespread interest in machine/deep learning encourages the researchers to apply artificial intelligence to several different domains such as finance, social media, and cyber security. With the EHR data becoming available for researchers, there has been an increasing interest in using it with deep learning algorithms. Within the scope of this study, we use the most popular and publicly available EHR dataset, Medical Information Mart for Intensive Care (MIMIC-III). Understanding the health condition of the patient by observing the clinical measurements, and laboratory tests, and predicting the condition of patients during their intensive care unit (ICU) stay is a vital problem. In this study, two different common risk prediction tasks, mortality (in-hospital \& in-ICU), and length of ICU stay (LOS $>$ 3, LOS $>7$) are researched. The interest of this work is divided into three parts. In the first part, we use the clinical notes besides the time-series features such as vital signs and laboratory test results to improve the model predictions. In the second part, instead of using clinical notes directly, we extract medical entities from clinical notes by clinical named entity recognition (NER) model and use them as additional features besides time-series features to improve proposed model predictions. In the last study, we argue the integration of structured time-series data and molecular representations of the drugs which are prescribed to patients in ICU. Several experiments are conducted to investigate the effect of clinical drugs on mortality and LOS problem predictions. Additionally, the SHapley Additive exPlanations (SHAP) is applied to increase the interpretability of the in-hospital mortality model and to investigate the relationship between the mortality and the time-series and clinical drug features. The output of the SHAP method allows us to make a deeper analysis of the effect of time-series and clinical drug features. Since MIMIC-III contains rich information with multiple modalities of data, we apply a multimodal learning approach to handle the heterogeneous nature of the data. The experimental results indicate a promising increase in performance on clinical tasks when the clinical notes, medical entities or clinical drug informations are used with time series features in a multimodal approach. |
URI: | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=qVqOZFj2DwNmvdf1oGFYiEWYdWMUmqCfWrUB2oD9UeO-IyD7HzsG9P0oOLUhyTqs https://hdl.handle.net/20.500.11851/10616 |
Appears in Collections: | Bilgisayar Mühendisliği Doktora Tezleri / Computer Engineering PhD Theses |
Files in This Item:
File | Size | Format | |
---|---|---|---|
760581.pdf | 3.86 MB | Unknown | View/Open |
CORE Recommender
Page view(s)
146
checked on Nov 4, 2024
Download(s)
32
checked on Nov 4, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.