Show simple item record

dc.contributor.advisorGelbal, Selahattin
dc.contributor.authorŞahin, Murat Doğan
dc.date.accessioned2017-06-14T10:32:47Z
dc.date.available2017-06-14T10:32:47Z
dc.date.issued2017
dc.date.submitted2017-04-14
dc.identifier.urihttp://hdl.handle.net/11655/3525
dc.description.abstractThis study aims to develop a multi-dimensional computerized adaptive test (MCAT) that measures grammar and vocabulary knowledge as well as general ability of the students attending Anadolu University School of Foreign Languages by using the data from Proficiency Exams administered for these student at the end of preparatory school education. To achieve this purpose, an item pool was created by using four different data sets each of which consists of 50 questions used in the previous proficiency exams administered at Anadolu Uniersity School of Foreign Languages. According to IRT-based analyses applied to the data, it was found that three-dimensional bifactor model was the most appropriate model for all item sets. Following the development of the item pool, a hybrid simulation was applied –by taking the missing matrix into consideration – in order to determine the algorithm to be used in real-time MCAT application. In this application, a total of 36 conditions were created in which different ability estimation methods (EAP and MAP), different item selection methods (D-rule, KL, W-rule, T-rule, weighted W-rule and weighted T-rule) and different termination rules (standard error, θ convergence, fixed number of items) were used. In these conditions, the correlation between estimated θ value and real value for each dimension; bias, RSMD and standard error values were obtained. Being an important indicator of measurement accuracy in CAT applications in addition to correlation values and error statistic, the number of items replied was also reported under the variable-length simulation conditions. According to the results obtained, it was found that D-rule item selection method and MAP ability prediction method give the best statistics for each different termination rule. Following the comparisons of best conditions for each termination rule, it was decided that the termination rules based on standard error as well as D-rule item selection method and MAP ability prediction method should be used for real-time MCAT application. By using this algorithm, a correlation was obtained between general ability levels obtained from the real-time application and the scores 32 students out of 99 received from paper-pencil test, who were applied real-time application. In addition, the total number of items administered to each individual and how frequently the items in item pool are used were reported based on the results obtained from the application carried out for 99 students. According to the results obtained from real-time application, it was found that 30% of the item pool, which includes a total of 200 items were used. It was also observed that the average number of items replied was 12.3 and nearly 75% of the participants replied 10 to 12 items.tr_TR
dc.description.tableofcontentsİÇİNDEKİLER KABUL ve ONAY ii ETİK BEYANNAMESİ iv TEŞEKKÜR v ÖZ vii ABSTRACT ix İÇİNDEKİLER xi TABLOLAR DİZİNİ xiv ŞEKİLLER DİZİNİ xv SİMGELER VE KISALTMALAR DİZİNİ xvi 1. GİRİŞ 1 1.1. Tek Boyutlu ve Çok Boyutlu Bireyselleştirilmiş Bilgisayarlı Testlerin Tarihi 5 1.2. Problem Durumu 8 1.3. Araştırmanın Amacı ve Önemi 9 1.4. Problem Cümlesi 11 1.4.1. Alt Problemler 11 1.5. Sayıltılar 13 1.6. Sınırlılıklar 13 1.7. Tanımlar 13 1.8. Araştırmanın Kuramsal Temeli 14 1.8.1 Madde Tepki Kuramı 14 1.8.1.1. Tek Boyutlu Madde Tepki Kuramı 14 1.8.1.2. Çok Boyutlu Madde Tepki Kuramı 18 1.8.2. Bireyselleştirilmiş Bilgisayarlı Testleri Geliştirme ve Uygulama Süreci 22 1.8.2.1. Madde Havuzunun Oluşturulması 24 1.8.2.2. Teste Başlama Kuralı 26 1.8.2.3. Yetenek Kestirim Yöntemi 26 1.8.2.3.1. Maksimum Olabilirlik Yöntemi (ML) 27 1.8.2.3.2. Bayes Kestirim Yöntemleri 28 1.8.2.4. Madde Seçim Yöntemi 28 1.8.2.5. Sonlandırma Kuralı 30 1.8.2.6. İçerik Ağırlıklandırması ve Madde Teşhir Oranının Kontrol Edilmesi 31 1.8.3. Simülasyon Süreci 32 1.8.4. BBT Uygulamalarının Avantajları ve Sınırlılıkları 33 1.8.5. Simülasyon ve Gerçek-Zamanlı BBT Uygulamaları için Kullanılan Yazılımlar 34 2. İLGİLİ ARAŞTIRMALAR 36 2.1. Çok Boyutlu BBT Uygulamaları ile İlgili Yurtdışında Yapılan Çalışmalar 36 2.2. BBT Uygulamaları ile İlgili Yurtiçinde Yapılan Çalışmalar 43 3. YÖNTEM 52 3.1. Araştırmanın Türü 52 3.2. Verilerin Elde Edilmesi 52 3.3. Verilerin Analizi 53 3.3.1. Madde Havuzunun Oluşturulması 54 3.3.1.1. Model – Veri Uyumunun Test Edilmesi 54 3.3.1.2. Madde Havuzunda Yer Alacak Maddelerin Kalibrasyonu 57 3.3.2. Simülasyon Süreci 60 3.3.3. Gerçek-Zamanlı Çok Boyutlu BBT (real-time MCAT) Uygulama Süreci 65 3.3.3.1. mirtCAT Paketinin Özelleştirilerek Yazılımın Oluşturulması 65 3.3.3.2. Gerçek-Zamanlı Uygulamanın Yapılması 70 4. BULGULAR 71 4.1. Alt Problem 1: Standart hataya dayalı sonlandırma kuralının kullanıldığı çok boyutlu BBT uygulamalarında farklı yetenek kestirim yöntemleri (EAP ve MAP) ve madde seçim kurallarına (D-rule, KL, W-rule, ağırlıklandırılmış W-rule, T-rule ve ağırlıklandırılmış T-rule) göre gerçek ve kestirilen yetenek düzeyleri arasındaki korelasyon, yanıtlanan ortalama madde sayısı, yanlılık (bias) ve RMSD değerleri nasıldır? 71 4.2. Alt Problem 2: θ değişimine dayalı sonlandırma kuralının kullanıldığı çokboyutlu BBT uygulamalarında farklı yetenek kestirim yöntemleri (EAP ve MAP) ve madde seçim kurallarına (D-rule, KL, W-rule, ağırlıklandırılmış W-rule, T-rule ve ağırlıklandırılmış T-rule) göre gerçek ve kestirilen yetenek düzeyleri arasındaki korelasyon, yanıtlanan ortalama madde sayısı, yanlılık (bias) ve RMSD değerleri nasıldır? 75 4.3. Alt Problem 3: Sabit madde sayısına dayalı sonlandırma kuralının kullanıldığı çok boyutlu BBT uygulamalarında farklı yetenek kestirim yöntemleri (EAP ve MAP) ve madde seçim kurallarına (D-rule, KL, W-rule, ağırlıklandırılmış W-rule, T-rule ve ağırlıklandırılmış T-rule) göre gerçek ve kestirilen yetenek düzeyleri arasındaki korelasyon, yanıtlanan ortalama madde sayısı, yanlılık (bias) ve RMSD değerleri nasıldır? 78 4.4. Alt Problem 4: Simülasyon sonuçlarına göre her bir sonlandırma kuralı için en uygun çok boyutlu BBT koşulu nedir? 81 4.5. Alt Problem 5: Gerçek-zamanlı çok boyutlu BBT uygulaması sonuçları nasıldır? 101 5. TARTIŞMA 105 5.1 Simülasyon Uygulaması Sonucu Elde Edilen Bulgulara İlişkin Yorumlar 106 5.2 Gerçek-Zamanlı Çok Boyutlu Uygulaması Sonucu Elde Edilen Bulgulara İlişkin Yorumlar 108 6. SONUÇ ve ÖNERİLER 110 6.1. Sonuçlar 110 6.2. Öneriler 114 6.2.1. Gelecekte Yapılacak Çok Boyutlu BBT Araştırmalarına Yönelik Öneriler 114 6.2.2 Gerçek-Zamanlı Çok Boyutlu BBT Uygulamalarına Yönelik Öneriler 116 KAYNAKÇA 118 EK 1. ETİK KOMİSYON İZİN MUAFİYETİ FORMU 126 EK 2. ORİJİNALLİK RAPORU 127 EK 3. ÇOK BOYUTLU BBT UYGULAMASI İÇİN KULLANILAN HAVUZDA YER ALAN MADDELERE AİT PARAMETRELER 129 EK 4. SİMÜLASYONLAR SONUCU HER BİR KOŞULDA TÜM BOYUTLAR İÇİN ELDE EDİLEN GRAFİKLER 131 EK 5. GERÇEK-ZAMANLI ÇOK BOYUTLU BBT UYGULAMASINDA KULLANILAN R KODLARI 158 EK 6. FARKLI SONLANDIRMA KURALLARININ KULLANILDIĞI KOŞULLAR İÇİN ELDE EDİLEN İSTATİSTİKLERE AİT GRAFİKLER 159 ÖZGEÇMİŞ 165tr_TR
dc.language.isoturtr_TR
dc.publisherEğitim Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/restrictedAccesstr_TR
dc.subjectÇok boyutlu bireyselleştirilmiş bilgisayarlı testtr_TR
dc.subjectMadde Tepki Kuramı
dc.subjectbifaktör model
dc.subjecthibrit simülasyon
dc.subjectgerçek-zamanlı uygulama
dc.titleGerçek ve Üretilmiş Veri Setlerinde Çok Boyutlu Bireyselleştirilmiş Bilgisayarlı Test Uygulama Sonuçlarının İncelenmesitr_TR
dc.typeinfo:eu-repo/semantics/doctoralThesistr_TR
dc.description.ozetBu çalışmada; Anadolu Üniversite YDYO’da öğrenim gören hazırlık sınıfı öğrencilerinin eğitimlerini bitirmelerinin ardından, lisans eğitimleri öncesi vermeleri gereken Yeterlilik Tespit Sınavının (YTS) verileri kullanılarak gramer ve kelime bilgisi becerileriyle birlikte bir de genel yetenek ölçen çok boyutlu bir bireyselleştirilmiş bilgisayarlı test (BBT) geliştirililmesi amaçlanmıştır. Buna yönelik olarak öncelikle, Anadolu Üniversitesi YDYO’da geçmiş yıllardaki YTS’lerde uygulanan ve her biri 50’şer sorudan oluşan dört farklı madde seti ile bu maddelere ait veriler kullanılarak bir madde havuzu oluşturulmuştur. MTK’ya dayalı olarak yapılan analizlerde her bir veri seti için sırasıyla tek boyutlu model, iki boyutlu model ve üç boyutlu bifaktör model uygulanmış ve tüm madde setleri için en uygun modelin üç boyutlu bifaktör model olduğu sonucuna varılmıştır. Madde havuzunun oluşturulmasının ardından, gerçek-zamanlı çok boyutlu BBT uygulamasında kullanılacak algoritmayı belirlemek amacıyla, eldeki eksik veri matrisi de göz önüne alınarak bir hibrit simülasyon uygulaması yapılmıştır. Bu simülasyon uygulamasında farklı yetenek kestirim yöntemlerinin (EAP ve MAP), farklı madde seçim yöntemlerinin (D-rule, KL, W-rule, T-rule, ağırlıklandırılmış W-rule ve ağırlıklandırılmış T-rule) ve farklı sonlandırma kurallarının (standart hata, θ değişimi ve sabit madde) kullanıldığı toplam 36 farklı koşul yaratılmış; bu koşullarda her bir boyut için gerçek ve kestirilen θ değerleri arasındaki korelasyon ile birlikte yanlılık, RMSD ve standart hata değerleri elde edilmiştir. Korelasyon değerleri ve hata istatistikleri ile birlikte, BBT uygulamalarında ölçme kesinliğinin önemli bir göstergesi olduğundan, değişken madde sayısına dayalı sonlandırma kuralının kullanıldığı koşullarda yanıtlanan madde sayısı da raporlanmıştır. Elde edilen sonuçlara göre; üç farklı sonlandırma kuralı için de D-rule madde seçim yöntemi ve MAP yetenek kestirim yönteminin en iyi istatistikleri verdiği bulgulanmıştır. Bir sonraki adımda her bir sonlandırma kuralı için en iyi koşullar karşılaştırılarak gerçek-zamanlı çok boyutlu BBT uygulaması için D-rule madde seçim yöntemi ve MAP yetenek kestirim yöntemiyle birlikte standart hataya dayalı sonlandırma kuralının kullanılmasına karar verilmiştir. Söz konusu algoritma kullanılarak gerçek-zamanlı çok boyutlu BBT uygulamasının yapıldığı 99 öğrenciden 32’sinin kağıt-kalem testiyle elde edilen toplam puanları ile gerçek-zamanlı uygulama sonucu elde edilen genel yetenek düzeyleri arasındaki korelasyon elde edilmiştir. Bunun yanında, uygulamanın yapıldığı toplam 99 kişinin sonuçlarına dayanarak havuzda yer alan maddelerin kullanım sıklıkları ve her bir bireyin yanıtladığı toplam madde sayısı da raporlanmıştır. Gerçek-zamanlı uygulama sonucu elde edilen sonuçlara göre; 200 maddeden oluşan havuzun %30’unun kullanıldığı görülmüştür. Testin bitirilmesiyle yanıtlanan ortalama madde sayısının 12.3 olduğu, ayrıca katılımcıların yaklaşık %75’inin 10 ile 12 arasında madde yanıtladıkları sonucuna ulaşılmıştır.tr_TR
dc.contributor.departmentEğitim Bilimleritr_TR


Files in this item

This item appears in the following Collection(s)

Show simple item record