dc.contributor.advisor | Karabulut, Erdem | |
dc.contributor.author | Cephe, Ahu | |
dc.date.accessioned | 2024-04-25T13:46:15Z | |
dc.date.issued | 2024-04-17 | |
dc.date.submitted | 2024-03-26 | |
dc.identifier.uri | https://hdl.handle.net/11655/34900 | |
dc.description.abstract | The number of people with cancer is increasing daily, and the mortality for cancer is constantly increasing since the biomarkers of many cancer types are unknown. Also, cancer doesn’t progress between individuals similarly, and all patients vary in response to the same treatment because of genetic differences. At this stage, it is very important to apply more effective treatments by making more accurate prognosis predictions using personalized medicine strategies. Estimating survival in cancer patients using survival time provides essential results. With the development of omics technologies, the relationship between survival time and gene expression profiles of patients can now be modeled. RNA-sequencing technology has been used in recent years for survival analysis omics-based due to its advantages. Although RNA-sequencing has many advantages, it differs from classical survival data with high-dimensionality, heterogeneity, and highly-correlated genes. Due to these problems, the regularized Cox methods and machine learning algorithms adapted to survival data are used instead of classical survival algorithms. However, the regularized Cox methods require some assumptions to be met using the Cox algorithm. Machine learning algorithms that are first created for classification problems and then adapted to survival data require additional time and effort. This study aims to develop new approaches that can be used in the survival analysis of RNA-sequencing data by combining voom transformation, stacking algorithm, and lasso methods with block structure. For this purpose, survival data can be converted into binary classification data with the stacking algorithm. Using the sample weights obtained after the voom transformation in priority-Lasso and IPF-Lasso algorithms, two new approaches are presented: voomStackPrio and voomStackIPF. Our approaches were applied to 12 real RNA-sequencing data from the TCGA database. Performance comparisons were made with other survival algorithms in the literature using Harrell’s concordance index. The results showed that the performance of the two new approaches was similar or better than other survival algorithms. | tr_TR |
dc.language.iso | en | tr_TR |
dc.publisher | Sağlık Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | sağkalım | tr_TR |
dc.subject | RNA-dizileme | |
dc.subject | voom | |
dc.subject | stacking | |
dc.subject | IPF-Lasso | |
dc.title | Novel Statıstıcal Approaches for Survıval Analysıs of Rna-Sequencıng Data | tr_TR |
dc.type | info:eu-repo/semantics/article | tr_TR |
dc.description.ozet | Kansere yakalanan insanların sayısı her geçen gün artmaktadır ve birçok kanser türüne ait biyobelirteçler bilinemediği için bu hastalıktan ölüm oranları da sürekli artış göstermektedir. Ayrıca, her kanser hastalığı her hastada aynı şekilde seyretmemekte ve her hasta aynı tedaviye aynı yanıtı vermemektedir. Bu aşamada, bireysel tıp stratejilerinden da yararlanarak daha doğru prognoz tahminleri yaparak daha etkili tedaviler uygulamak oldukça önemlidir. Kanser hastalarında olay zamanı değişkenlerinden yararlanarak sağkalım tahminlemesi yapmak bize çok önemli sonuçlar sağlamaktadır. Omics teknolojilerinin de gelişmesiyle birlikte artık sağkalım zamanı ve hastaların gen ifade profilleri arasındaki ilişki modellenebilmektedir. Bu çalışmalarda son yıllarda avantajlarından dolayı RNA-dizileme verileri kullanılmaktadır. Ancak, RNA-dizileme verileri klasik sağkalım verilerinden farklı olarak yüksek-boyutluluk, heterojenlik ve yüksek-korelasyonlı genleri bulundurma özelliklerine sahiptir. Bu özelliklerinden dolayı klasik sağkalım algoritmaları yerine düzenlileştirilmiş Cox yöntemleri ve sağkalım verilerine uyarlanmış makine öğrenmesi algoritmaları kullanılmaktadır. Ancak, düzenlileştirilmiş Cox yöntemleri Cox algoritmasının kullanımında sağlanması gereken bir takım varsayımları gerektirmektedir. Genellikle önce sınıflandırma problemleri için oluşturulup daha sonra sağkalım verilerine uyarlanan makine öğrenmesi algoritmaları da ek bir zaman ve çaba gerektirmektedir. Bu çalışmada, voom dönüşümü, stacking algoritması ve bloklu lasso yöntemlerini birleştirerek RNA-dizileme verilerinin sağkalım analizlerinde kullanılabilecek yeni yaklaşımlar geliştirilmesi amaçlanmıştır. Bu amaçla, stacking algoritması ile sağkalım verileri ikili sınıflandırma verilerine dönüştürülebilmektedir. Voom dönüşümü sonrası elde edilen gözlem ağırlıkları da priority-Lasso ve IPF-Lasso algoritmalarında kullanılarak voomStackPrio ve voomStackIPF adında iki adet yeni yaklaşım sunulmuştur. Geliştirdiğimiz bu yaklaşımlar TCGA veritabanından alınan on iki adet gerçek RNA-dizileme verisinde uygulanmıştır. Harrell’ın Concordance İndeksi kullanılarak literatürde yer alan diğer sağkalım algoritmaları ile performans karşılaştırılması yapılmıştır. Sonuçlar, çalışma kapsamında geliştirilen iki adet yeni yaklaşımın performansının diğer sağkalım algoritmaları ile benzer veya daha iyi olduğunu göstermiştir. | tr_TR |
dc.contributor.department | Biyoistatistik | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | 2024-04-25T13:46:16Z | |
dc.funding | Yok | tr_TR |
dc.subtype | presentation | tr_TR |