dc.contributor.advisor | Anıl, Duygu | |
dc.contributor.author | Büyükatak, Emrah | |
dc.date.accessioned | 2022-04-01T06:43:14Z | |
dc.date.issued | 2022 | |
dc.date.submitted | 2022-01-28 | |
dc.identifier.citation | Büyükatak, E. (2022). PISA 2018 Türkiye örnekleminde okuma okuryazarlık düzeylerinin farklı veri madenciliği sınıflandırma yöntemleri ile incelenmesi. (Doktora tezi). Hacettepe Üniversitesi, Ankara. | tr_TR |
dc.identifier.uri | http://hdl.handle.net/11655/26019 | |
dc.description.abstract | The purpose of research is to determine the classification accuracy of students' success status and reading skills proficiency levels according to the factors affecting the success of students' reading skills and their success scores based on the PISA 2018 Turkey sample by using Artificial Neural Networks, Decision Trees, K-Nearest Neighborhood and Naive Bayes methods and to examine the general characteristics of success groups. In the research, 6890 student questionnaires were used. Firstly, the missing data were examined and completed. Secondly, 24 index variables were determined by examining the literature, PISA 2018 Technical Report and data. Thirdly, the students were scaled in 2 categories as “Successful-Unsuccessful” according to the scores of PISA 2018 reading test and in 3 categories as “Level-1”, “Level-2” and “Level-3” according to their proficiency levels. Statistical analysis was conducted with SPSS MODELER. At the end of the research, Decision Trees C5.0 had the highest classification rate with 89.6%, QUEST had the lowest classification rate with 75%, and four clusters were obtained with the Two-Step Clustering analysis method to according to the success scores. C5.0 had the highest classification rate with 88.6% and the QUEST had the lowest classification rate with 61.7%, and three clusters whose distributions are not proportionally close to each other were obtained. It can be said that the data sets are suitable for clustering and according to both their achievement scores and their levels, all data mining methods can be used to classify students because of their ability to correctly classify beyond random classification. | tr_TR |
dc.language.iso | tur | tr_TR |
dc.publisher | Eğitim Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | PISA | tr_TR |
dc.subject | Okuma becerileri | tr_TR |
dc.subject | Veri madenciliği | tr_TR |
dc.subject | Kümele analizi | tr_TR |
dc.subject | Sınıflandırma | tr_TR |
dc.subject.lcsh | Bilgi kaynakları | tr_TR |
dc.title | PISA 2018 Türkiye Örnekleminde Okuma Okuryazarlık Düzeylerinin Farklı Veri Madenciliği Sınıflandırma Yöntemleri ile İncelenmesi | tr_TR |
dc.type | info:eu-repo/semantics/doctoralThesis | tr_TR |
dc.description.ozet | Bu araştırmanın amacı PISA 2018 Türkiye örneklemine dayalı olarak öğrencilerin okuma becerileri başarısını etkileyen faktörlere ve başarı puanlarına göre başarı durumlarının ve okuma becerileri yeterlilik düzeylerinin Yapay Sinir Ağları, Karar Ağaçları, K-En Yakın Komşuluk ve Naive Bayes yöntemleri ile sınıflama doğruluklarının belirlenmesi ve başarı gruplarının genel karakteristiğinin incelenmesidir. Araştırmada PISA 2018 Türkiye uygulamasına katılan 6890 öğrenci anketi kullanılmıştır. Birinci aşamada kayıp veri incelenmiş ve eksik veriler tamamlanmıştır. İkinci aşamada alanyazın, PISA 2018 Teknik Rapor ve veriler incelenerek okuma becerileri başarısını etkilediği düşünülen 24 indis değişken belirlenmiştir. Üçüncü aşamada alt problemler dikkate alınarak öğrenciler PISA 2018 okuma becerileri başarı testi puanlarına göre “Başarılı-Başarısız” olarak 2 ve yeterlik düzeylerine göre “Düzey-1”, “Düzey-2” ve “Düzey-3” olarak 3 kategoride ölçeklenmiştir. Verilerin istatistiksel çözümlemeleri SPSS MODELER programı ile yapılmıştır. Araştırma sonunda başarı puanlarına göre; Karar Ağaçları C5.0 algoritmasının %89.6 ile en yüksek, QUEST algoritmasının %75 ile en düşük sınıflama oranına sahip olduğu, genel karakteristiğin incelenmesinde iki aşamalı kümeleme analizi yöntemiyle gruplandırılması sonucunda dağılımları oransal olarak birbirine yakın dört küme elde edildiği, başarı düzeylerine göre de Karar Ağaçları C5.0 algoritmasının %88.6 ile en yüksek, QUEST algoritması da %61.7 ile en düşük sınıflama oranına sahip olduğu, genel karakteristiğin incelenmesi sonucunda dağılımları oransal olarak birbirine yakın olmayan üç küme elde edildiği belirlenmiştir. Her iki kümeleme analizinde de 0,1 olarak hesaplanan Sihoutte Katsayısının 0 değerinden büyük olmasından dolayı veri setlerinin kümeleme yapılmaya elverişli olduğu ifade edilebilir. Hem başarı puanlarına hem de düzeylerine göre bütün veri madenciliği yöntemlerinin rastgele sınıflamanın ötesinde doğru sınıflandırma yapabilmesi sebebiyle öğrencileri sınıflandırmada kullanılabileceği sonucuna varılabilir. | tr_TR |
dc.contributor.department | Eğitim Bilimleri | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | 2022-04-01T06:43:14Z | |
dc.funding | Yok | tr_TR |
dc.subtype | annotation | tr_TR |
dc.subtype | dataset | tr_TR |