dc.contributor.advisor | Doğan, Tunca | |
dc.contributor.author | Çoruh, Ayşe Nur | |
dc.date.accessioned | 2022-10-12T11:02:26Z | |
dc.date.issued | 2022 | |
dc.date.submitted | 2022-09-07 | |
dc.identifier.uri | http://hdl.handle.net/11655/26881 | |
dc.description.abstract | Cancer is one of the leading causes of death worldwide. The high lethality of some of the sub-types of cancer increases the importance of correct diagnosis, complete follow-up and effective treatment. Survivability in cancer can be defined as the length of time that patients live after the diagnosis and/or the administration of a certain treatment. The estimation of survival, which is a critical topic in biomedicine, is possible using relevant indicators and historical patient data. Until lately, researchers mainly used clinical and demographic data of patients to model survivability, which generally resulted in low success, due to ignoring patient-specific molecular properties that affect both the response given to a treatment and the progression of the disease in general. In this study, we proposed a new computational method to predict the survival of cancer patients. For this purpose, we utilized multi-omics data of patients diagnosed with 1 of the 13 different types of cancer, which are obtained from Genomic Data Commons (GDC) data portal. We used mutation, copy number variation (CNV), gene expression, and miRNA expression as our input omic data types. In addition, we incorporated the clinical data and administered drug information of the patients, to our input features. We utilized the random forest algorithm and trained 13 tissue/cancer specific binary classification models. According to our results, models that use multiple types of omic data achieved better prediction performance, compared to the models using a single-omic. Among different types of omics data, mutation and gene expression features provided the highest prediction performance, in the majority of the tissues. This study contributes to the literature as a detailed investigation of different molecular data types for tissue specific prediction of cancer patient survival. | tr_TR |
dc.language.iso | tur | tr_TR |
dc.publisher | Sağlık Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | Sağkalım tahmini | tr_TR |
dc.subject | Makine öğrenmesi | tr_TR |
dc.subject | Kanser araştırmaları | tr_TR |
dc.subject | Çoklu omik tabanlı analizler | tr_TR |
dc.subject.lcsh | Q- Bilim | tr_TR |
dc.title | Kişiselleştirilmiş Sağkalım Tahmini İçin Geniş Çaplı Kanser Verisinin Yapay Öğrenme ve Çoklu-Omik Bazlı Analizi | tr_TR |
dc.type | info:eu-repo/semantics/masterThesis | tr_TR |
dc.description.ozet | Kanser, dünyada en önde gelen sağlık sorunlarından bir tanesidir. Özellikle bazı kanser alt türlerinin öldürücülüğünün yüksek olması, doğru teşhis, eksiksiz takip ve etkili tedavinin önemini artırmaktadır. Kanserde hayatta kalma, hastaların teşhisinden veya belirli bir tedavinin uygulanmasından sonra hayatta kaldıkları süre olarak tanımlanabilir. Biyotıp alanında kritik öneme sahip bir konu olan hayatta kalma tahmini, ilgili göstergeler ve geçmiş hasta verisi kullanılarak gerçekleştirilmektedir. Yakın zamana kadar, araştırmacılar sağkalımı modellemek için hastaların klinik ve demografik verisi kullanmışlardır. Bu yaklaşım çerçevesinde hem bir tedaviye verilen yanıtın hem de genel olarak hastalığın ilerlemesini etkileyen hastaya özgü moleküler özelliklerin göz ardı edilmesinden dolayı, genellikle düşük bir sağkalım tahmini başarısı elde edilmektedir. Bu çalışmada, kanser hastalarının sağkalımını yüksek başarımla tahmin etmek için yeni bir hesaplama yöntemi önerdik. Bu amaçla, “Genomic Data Commons” (GDC) veri kaynağından elde edilen seçili 13 farklı kanser türünden herhangi biri için teşhis edilen hastaların çoklu omik verisi kullanılmıştır. Girdi omik veri tipleri olarak mutasyon, kopya sayısı varyasyonu (CNV), gen ifadesi ve miRNA ifadeleri seçilmiştir. Ayrıca hastaların klinik verisinin ve uygulanan ilaç bilgilerini girdi özniteliklerine dahil edilmiştir. Rastgele orman algoritmasını kullanarak 13 farklı doku/kanser tipi için spesifik ikili sınıflandırma modelleri eğitilmiştir. Sonuçlarımıza göre, birden çok türde omik veri kullanan modeller, tek omik veri tipi kullanan modellere kıyasla daha iyi tahmin performansı elde edilmiştir. Farklı tipteki omik veri tipleri arasında, dokuların çoğunda mutasyon ve gen ifade özellikleri en yüksek tahmin performansını sağlamıştır. Bu çalışma, kanser hastalarının sağkalım sürelerinin dokuya özgü tahmini için farklı moleküler veri tiplerinin ayrıntılı bir araştırması olarak literatüre katkıda bulunmaktadır. | tr_TR |
dc.contributor.department | Biyoinformatik | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | 2022-10-12T11:02:26Z | |
dc.funding | Yok | tr_TR |