Basit öğe kaydını göster

dc.contributor.advisorAnıl, Duygu
dc.contributor.authorBüyükatak, Emrah
dc.date.accessioned2022-04-01T06:43:14Z
dc.date.issued2022
dc.date.submitted2022-01-28
dc.identifier.citationBüyükatak, E. (2022). PISA 2018 Türkiye örnekleminde okuma okuryazarlık düzeylerinin farklı veri madenciliği sınıflandırma yöntemleri ile incelenmesi. (Doktora tezi). Hacettepe Üniversitesi, Ankara.tr_TR
dc.identifier.urihttp://hdl.handle.net/11655/26019
dc.description.abstractThe purpose of research is to determine the classification accuracy of students' success status and reading skills proficiency levels according to the factors affecting the success of students' reading skills and their success scores based on the PISA 2018 Turkey sample by using Artificial Neural Networks, Decision Trees, K-Nearest Neighborhood and Naive Bayes methods and to examine the general characteristics of success groups. In the research, 6890 student questionnaires were used. Firstly, the missing data were examined and completed. Secondly, 24 index variables were determined by examining the literature, PISA 2018 Technical Report and data. Thirdly, the students were scaled in 2 categories as “Successful-Unsuccessful” according to the scores of PISA 2018 reading test and in 3 categories as “Level-1”, “Level-2” and “Level-3” according to their proficiency levels. Statistical analysis was conducted with SPSS MODELER. At the end of the research, Decision Trees C5.0 had the highest classification rate with 89.6%, QUEST had the lowest classification rate with 75%, and four clusters were obtained with the Two-Step Clustering analysis method to according to the success scores. C5.0 had the highest classification rate with 88.6% and the QUEST had the lowest classification rate with 61.7%, and three clusters whose distributions are not proportionally close to each other were obtained. It can be said that the data sets are suitable for clustering and according to both their achievement scores and their levels, all data mining methods can be used to classify students because of their ability to correctly classify beyond random classification.tr_TR
dc.language.isoturtr_TR
dc.publisherEğitim Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccesstr_TR
dc.subjectPISAtr_TR
dc.subjectOkuma becerileritr_TR
dc.subjectVeri madenciliğitr_TR
dc.subjectKümele analizitr_TR
dc.subjectSınıflandırmatr_TR
dc.subject.lcshBilgi kaynaklarıtr_TR
dc.titlePISA 2018 Türkiye Örnekleminde Okuma Okuryazarlık Düzeylerinin Farklı Veri Madenciliği Sınıflandırma Yöntemleri ile İncelenmesitr_TR
dc.typeinfo:eu-repo/semantics/doctoralThesistr_TR
dc.description.ozetBu araştırmanın amacı PISA 2018 Türkiye örneklemine dayalı olarak öğrencilerin okuma becerileri başarısını etkileyen faktörlere ve başarı puanlarına göre başarı durumlarının ve okuma becerileri yeterlilik düzeylerinin Yapay Sinir Ağları, Karar Ağaçları, K-En Yakın Komşuluk ve Naive Bayes yöntemleri ile sınıflama doğruluklarının belirlenmesi ve başarı gruplarının genel karakteristiğinin incelenmesidir. Araştırmada PISA 2018 Türkiye uygulamasına katılan 6890 öğrenci anketi kullanılmıştır. Birinci aşamada kayıp veri incelenmiş ve eksik veriler tamamlanmıştır. İkinci aşamada alanyazın, PISA 2018 Teknik Rapor ve veriler incelenerek okuma becerileri başarısını etkilediği düşünülen 24 indis değişken belirlenmiştir. Üçüncü aşamada alt problemler dikkate alınarak öğrenciler PISA 2018 okuma becerileri başarı testi puanlarına göre “Başarılı-Başarısız” olarak 2 ve yeterlik düzeylerine göre “Düzey-1”, “Düzey-2” ve “Düzey-3” olarak 3 kategoride ölçeklenmiştir. Verilerin istatistiksel çözümlemeleri SPSS MODELER programı ile yapılmıştır. Araştırma sonunda başarı puanlarına göre; Karar Ağaçları C5.0 algoritmasının %89.6 ile en yüksek, QUEST algoritmasının %75 ile en düşük sınıflama oranına sahip olduğu, genel karakteristiğin incelenmesinde iki aşamalı kümeleme analizi yöntemiyle gruplandırılması sonucunda dağılımları oransal olarak birbirine yakın dört küme elde edildiği, başarı düzeylerine göre de Karar Ağaçları C5.0 algoritmasının %88.6 ile en yüksek, QUEST algoritması da %61.7 ile en düşük sınıflama oranına sahip olduğu, genel karakteristiğin incelenmesi sonucunda dağılımları oransal olarak birbirine yakın olmayan üç küme elde edildiği belirlenmiştir. Her iki kümeleme analizinde de 0,1 olarak hesaplanan Sihoutte Katsayısının 0 değerinden büyük olmasından dolayı veri setlerinin kümeleme yapılmaya elverişli olduğu ifade edilebilir. Hem başarı puanlarına hem de düzeylerine göre bütün veri madenciliği yöntemlerinin rastgele sınıflamanın ötesinde doğru sınıflandırma yapabilmesi sebebiyle öğrencileri sınıflandırmada kullanılabileceği sonucuna varılabilir.tr_TR
dc.contributor.departmentEğitim Bilimleritr_TR
dc.embargo.termsAcik erisimtr_TR
dc.embargo.lift2022-04-01T06:43:14Z
dc.fundingYoktr_TR
dc.subtypeannotationtr_TR
dc.subtypedatasettr_TR


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster