Basit öğe kaydını göster

dc.contributor.advisorKarabulut, Erdem
dc.contributor.authorArık, Özlem
dc.date.accessioned2020-08-10T10:34:38Z
dc.date.issued2020-08-07
dc.date.submitted2020-07-14
dc.identifier.urihttp://hdl.handle.net/11655/22538
dc.description.abstractBioinformatics is an interdisciplinary branch of science that combines statistics, biology, computing, mathematics, and genetics, and thanks to the analysis in bioinformatics, it can be shown which abnormalities causes which disease. In cancer disease, diagnosis with microarray gene expression data, classification procedures and identification of genes that are effective in the structure of cancer are of great importance for early diagnosis of the disease. In the thesis, microarray gene expression data of lung, kidney, lymphoma, cervical, prostate, breast and leukemia cancer types were studied. Since the number of features of the data is high, varFilter, nsFilter, rf, lasso, rfe and limma feature selection methods have been discussed. In filtered data sets, classification models were constructed with Naive Bayes, Support Vector Machines, k-Nearest Neighbor, Artificial Neural Networks and Deep Learning method, which has gained popularity in recent years. Accuracy, sensitivity, specificity and AUC were obtained to demonstrate which classification methods are better in the subject feature selection methods and to compare the performance and success of the generated classification models. Generally, classification models obtained in lasso and limma feature selection methods are more successful than models obtained in other feature selection methods. Deep Learning method is also generally more successful than classical data mining classification methods. Deep learning classification models were also obtained without applying the feature selection method on the datasets. It was compared whether there is a difference between the performances of deep learning models obtained by applying and without applying feature selection methods. In addition, implementation steps were carried out in four different simulation data. Similar results were obtained on real and simulation datasets.tr_TR
dc.language.isoturtr_TR
dc.publisherSağlık Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/closedAccesstr_TR
dc.subjectVeri Madenciliğitr_TR
dc.subject.lcshQ- Bilimtr_TR
dc.titleMikrodizi Gen İfade Verilerinde Farklı Öznitelik Seçim Yöntemleri ile Sınıflama Yöntemlerinin Performanslarının Değerlendirilmesitr_TR
dc.typeinfo:eu-repo/semantics/doctoralThesistr_TR
dc.description.ozetİstatistik, biyoloji, bilgisayar, matematik ve genetik bilimlerini bir arada kullanan disiplinler arası bir bilim dalı olan biyoinformatik sayesinde, hangi anormalliklerin hangi hastalığa neden olduğu gösterilebilmektedir. Kanser hastalığında mikrodizi gen ifade verileri ile yapılan teşhis, sınıflama işlemleri, kanserin yapısında etkili olan genlerin belirlenmesi erken teşhiste önemlidir. Bu tez çalışmasında da akciğer, lenfoma, rahim ağzı, prostat, meme ve lösemi kanser türlerine ait mikrodizi gen ifade verileri üzerinde çalışılmıştır. Verilerin öznitelik sayısı fazla olduğu için daha az sayıda öznitelik ile çalışmak amacıyla varFilter, nsFilter, rf, lasso, rfe ve limma öznitelik seçim yöntemleri ele alınmıştır. Öznitelik seçimi yapılmış veri setlerinde Naive Bayes, Destek Vektör Makineleri, k-En Yakın Komşu ve Yapay Sinir Ağları sınıflama yöntemleri ile son yıllarda popülerlik kazanan Derin Öğrenme yöntemi ile sınıflama modelleri oluşturulmuştur. Veri setlerinde, ele alınan öznitelik seçim yöntemlerinin hangi sınıflama yöntemlerinde daha iyi olduğunu göstermek ve oluşturulan sınıflama modellerinin performanslarını karşılaştırmak için doğruluk, duyarlılık, seçicilik ve ROC eğrisi altında kalan alan değerleri elde edilmiştir. Genellikle lasso ve limma öznitelik seçim yöntemlerinde oluşturulan sınıflama modelleri diğer öznitelik seçim yöntemlerinde oluşturulan modellere göre daha başarılıdır. Derin Öğrenme yöntemi de klasik veri madenciliği sınıflama yöntemlerine göre çoğunlukla daha iyi performans göstermiştir. Veri setleri üzerinde öznitelik seçim yöntemi uygulamadan Derin Öğrenme sınıflama modelleri de elde edilmiştir. Öznitelik seçim yöntemlerini uygulayarak ve uygulamadan elde edilen Derin Öğrenme modellerinin performansları da karşılaştırılmıştır. Ayrıca benzetim çalışması yapılmıştır ve gerçek veri setlerine benzer sonuçlar elde edilmiştir.tr_TR
dc.contributor.departmentBiyoistatistiktr_TR
dc.embargo.terms6 aytr_TR
dc.embargo.lift2021-02-12T10:34:38Z
dc.fundingYoktr_TR


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster