PISA 2018 Türkiye Örnekleminde Okuma Okuryazarlık Düzeylerinin Farklı Veri Madenciliği Sınıflandırma Yöntemleri ile İncelenmesi

Büyükatak, Emrah

dc.contributor.advisor	Anıl, Duygu
dc.contributor.author	Büyükatak, Emrah
dc.date.accessioned	2022-04-01T06:43:14Z
dc.date.issued	2022
dc.date.submitted	2022-01-28
dc.identifier.citation	Büyükatak, E. (2022). PISA 2018 Türkiye örnekleminde okuma okuryazarlık düzeylerinin farklı veri madenciliği sınıflandırma yöntemleri ile incelenmesi. (Doktora tezi). Hacettepe Üniversitesi, Ankara.	tr_TR
dc.identifier.uri	http://hdl.handle.net/11655/26019
dc.description.abstract	The purpose of research is to determine the classification accuracy of students' success status and reading skills proficiency levels according to the factors affecting the success of students' reading skills and their success scores based on the PISA 2018 Turkey sample by using Artificial Neural Networks, Decision Trees, K-Nearest Neighborhood and Naive Bayes methods and to examine the general characteristics of success groups. In the research, 6890 student questionnaires were used. Firstly, the missing data were examined and completed. Secondly, 24 index variables were determined by examining the literature, PISA 2018 Technical Report and data. Thirdly, the students were scaled in 2 categories as “Successful-Unsuccessful” according to the scores of PISA 2018 reading test and in 3 categories as “Level-1”, “Level-2” and “Level-3” according to their proficiency levels. Statistical analysis was conducted with SPSS MODELER. At the end of the research, Decision Trees C5.0 had the highest classification rate with 89.6%, QUEST had the lowest classification rate with 75%, and four clusters were obtained with the Two-Step Clustering analysis method to according to the success scores. C5.0 had the highest classification rate with 88.6% and the QUEST had the lowest classification rate with 61.7%, and three clusters whose distributions are not proportionally close to each other were obtained. It can be said that the data sets are suitable for clustering and according to both their achievement scores and their levels, all data mining methods can be used to classify students because of their ability to correctly classify beyond random classification.	tr_TR
dc.language.iso	tur	tr_TR
dc.publisher	Eğitim Bilimleri Enstitüsü	tr_TR
dc.rights	info:eu-repo/semantics/openAccess	tr_TR
dc.subject	PISA	tr_TR
dc.subject	Okuma becerileri	tr_TR
dc.subject	Veri madenciliği	tr_TR
dc.subject	Kümele analizi	tr_TR
dc.subject	Sınıflandırma	tr_TR
dc.subject.lcsh	Bilgi kaynakları	tr_TR
dc.title	PISA 2018 Türkiye Örnekleminde Okuma Okuryazarlık Düzeylerinin Farklı Veri Madenciliği Sınıflandırma Yöntemleri ile İncelenmesi	tr_TR
dc.type	info:eu-repo/semantics/doctoralThesis	tr_TR
dc.description.ozet	Bu araştırmanın amacı PISA 2018 Türkiye örneklemine dayalı olarak öğrencilerin okuma becerileri başarısını etkileyen faktörlere ve başarı puanlarına göre başarı durumlarının ve okuma becerileri yeterlilik düzeylerinin Yapay Sinir Ağları, Karar Ağaçları, K-En Yakın Komşuluk ve Naive Bayes yöntemleri ile sınıflama doğruluklarının belirlenmesi ve başarı gruplarının genel karakteristiğinin incelenmesidir. Araştırmada PISA 2018 Türkiye uygulamasına katılan 6890 öğrenci anketi kullanılmıştır. Birinci aşamada kayıp veri incelenmiş ve eksik veriler tamamlanmıştır. İkinci aşamada alanyazın, PISA 2018 Teknik Rapor ve veriler incelenerek okuma becerileri başarısını etkilediği düşünülen 24 indis değişken belirlenmiştir. Üçüncü aşamada alt problemler dikkate alınarak öğrenciler PISA 2018 okuma becerileri başarı testi puanlarına göre “Başarılı-Başarısız” olarak 2 ve yeterlik düzeylerine göre “Düzey-1”, “Düzey-2” ve “Düzey-3” olarak 3 kategoride ölçeklenmiştir. Verilerin istatistiksel çözümlemeleri SPSS MODELER programı ile yapılmıştır. Araştırma sonunda başarı puanlarına göre; Karar Ağaçları C5.0 algoritmasının %89.6 ile en yüksek, QUEST algoritmasının %75 ile en düşük sınıflama oranına sahip olduğu, genel karakteristiğin incelenmesinde iki aşamalı kümeleme analizi yöntemiyle gruplandırılması sonucunda dağılımları oransal olarak birbirine yakın dört küme elde edildiği, başarı düzeylerine göre de Karar Ağaçları C5.0 algoritmasının %88.6 ile en yüksek, QUEST algoritması da %61.7 ile en düşük sınıflama oranına sahip olduğu, genel karakteristiğin incelenmesi sonucunda dağılımları oransal olarak birbirine yakın olmayan üç küme elde edildiği belirlenmiştir. Her iki kümeleme analizinde de 0,1 olarak hesaplanan Sihoutte Katsayısının 0 değerinden büyük olmasından dolayı veri setlerinin kümeleme yapılmaya elverişli olduğu ifade edilebilir. Hem başarı puanlarına hem de düzeylerine göre bütün veri madenciliği yöntemlerinin rastgele sınıflamanın ötesinde doğru sınıflandırma yapabilmesi sebebiyle öğrencileri sınıflandırmada kullanılabileceği sonucuna varılabilir.	tr_TR
dc.contributor.department	Eğitim Bilimleri	tr_TR
dc.embargo.terms	Acik erisim	tr_TR
dc.embargo.lift	2022-04-01T06:43:14Z
dc.funding	Yok	tr_TR
dc.subtype	annotation	tr_TR
dc.subtype	dataset	tr_TR

Bu öğenin dosyaları:

Ad:: EMRAHBUYUKATAK_DOKTORATEZİ.pdf
Boyut:: 1.897Mb
Biçim:: PDF

Göster/Aç

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Eğitim Bilimleri Bölümü Tez Koleksiyonu [685]

Basit öğe kaydını göster