Kişiselleştirilmiş Sağkalım Tahmini İçin Geniş Çaplı Kanser Verisinin Yapay Öğrenme ve Çoklu-Omik Bazlı Analizi

Çoruh, Ayşe Nur

dc.contributor.advisor	Doğan, Tunca
dc.contributor.author	Çoruh, Ayşe Nur
dc.date.accessioned	2022-10-12T11:02:26Z
dc.date.issued	2022
dc.date.submitted	2022-09-07
dc.identifier.uri	http://hdl.handle.net/11655/26881
dc.description.abstract	Cancer is one of the leading causes of death worldwide. The high lethality of some of the sub-types of cancer increases the importance of correct diagnosis, complete follow-up and effective treatment. Survivability in cancer can be defined as the length of time that patients live after the diagnosis and/or the administration of a certain treatment. The estimation of survival, which is a critical topic in biomedicine, is possible using relevant indicators and historical patient data. Until lately, researchers mainly used clinical and demographic data of patients to model survivability, which generally resulted in low success, due to ignoring patient-specific molecular properties that affect both the response given to a treatment and the progression of the disease in general. In this study, we proposed a new computational method to predict the survival of cancer patients. For this purpose, we utilized multi-omics data of patients diagnosed with 1 of the 13 different types of cancer, which are obtained from Genomic Data Commons (GDC) data portal. We used mutation, copy number variation (CNV), gene expression, and miRNA expression as our input omic data types. In addition, we incorporated the clinical data and administered drug information of the patients, to our input features. We utilized the random forest algorithm and trained 13 tissue/cancer specific binary classification models. According to our results, models that use multiple types of omic data achieved better prediction performance, compared to the models using a single-omic. Among different types of omics data, mutation and gene expression features provided the highest prediction performance, in the majority of the tissues. This study contributes to the literature as a detailed investigation of different molecular data types for tissue specific prediction of cancer patient survival.	tr_TR
dc.language.iso	tur	tr_TR
dc.publisher	Sağlık Bilimleri Enstitüsü	tr_TR
dc.rights	info:eu-repo/semantics/openAccess	tr_TR
dc.subject	Sağkalım tahmini	tr_TR
dc.subject	Makine öğrenmesi	tr_TR
dc.subject	Kanser araştırmaları	tr_TR
dc.subject	Çoklu omik tabanlı analizler	tr_TR
dc.subject.lcsh	Q- Bilim	tr_TR
dc.title	Kişiselleştirilmiş Sağkalım Tahmini İçin Geniş Çaplı Kanser Verisinin Yapay Öğrenme ve Çoklu-Omik Bazlı Analizi	tr_TR
dc.type	info:eu-repo/semantics/masterThesis	tr_TR
dc.description.ozet	Kanser, dünyada en önde gelen sağlık sorunlarından bir tanesidir. Özellikle bazı kanser alt türlerinin öldürücülüğünün yüksek olması, doğru teşhis, eksiksiz takip ve etkili tedavinin önemini artırmaktadır. Kanserde hayatta kalma, hastaların teşhisinden veya belirli bir tedavinin uygulanmasından sonra hayatta kaldıkları süre olarak tanımlanabilir. Biyotıp alanında kritik öneme sahip bir konu olan hayatta kalma tahmini, ilgili göstergeler ve geçmiş hasta verisi kullanılarak gerçekleştirilmektedir. Yakın zamana kadar, araştırmacılar sağkalımı modellemek için hastaların klinik ve demografik verisi kullanmışlardır. Bu yaklaşım çerçevesinde hem bir tedaviye verilen yanıtın hem de genel olarak hastalığın ilerlemesini etkileyen hastaya özgü moleküler özelliklerin göz ardı edilmesinden dolayı, genellikle düşük bir sağkalım tahmini başarısı elde edilmektedir. Bu çalışmada, kanser hastalarının sağkalımını yüksek başarımla tahmin etmek için yeni bir hesaplama yöntemi önerdik. Bu amaçla, “Genomic Data Commons” (GDC) veri kaynağından elde edilen seçili 13 farklı kanser türünden herhangi biri için teşhis edilen hastaların çoklu omik verisi kullanılmıştır. Girdi omik veri tipleri olarak mutasyon, kopya sayısı varyasyonu (CNV), gen ifadesi ve miRNA ifadeleri seçilmiştir. Ayrıca hastaların klinik verisinin ve uygulanan ilaç bilgilerini girdi özniteliklerine dahil edilmiştir. Rastgele orman algoritmasını kullanarak 13 farklı doku/kanser tipi için spesifik ikili sınıflandırma modelleri eğitilmiştir. Sonuçlarımıza göre, birden çok türde omik veri kullanan modeller, tek omik veri tipi kullanan modellere kıyasla daha iyi tahmin performansı elde edilmiştir. Farklı tipteki omik veri tipleri arasında, dokuların çoğunda mutasyon ve gen ifade özellikleri en yüksek tahmin performansını sağlamıştır. Bu çalışma, kanser hastalarının sağkalım sürelerinin dokuya özgü tahmini için farklı moleküler veri tiplerinin ayrıntılı bir araştırması olarak literatüre katkıda bulunmaktadır.	tr_TR
dc.contributor.department	Biyoinformatik	tr_TR
dc.embargo.terms	Acik erisim	tr_TR
dc.embargo.lift	2022-10-12T11:02:26Z
dc.funding	Yok	tr_TR

Bu öğenin dosyaları:

Ad:: TEZ-imzalar sansürlü form.pdf
Boyut:: 2.441Mb
Biçim:: PDF

Göster/Aç

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Biyoinformatik [12]
Biyoinformatik

Basit öğe kaydını göster