Dengesiz Verilerde Sentetik Azınlık Aşırı Örnek Tekniklerinin (Smote) Karşılaştırılması: İnme Verisi Örneği

dc.contributor.authorÖzer Önder
dc.contributor.departmentİstatistik
dc.date.accessioned2026-06-02T12:07:02Z
dc.date.issued2025
dc.description.abstractThe class imbalance problem remains one of the most significant challenges limiting the effectiveness of classification algorithms in contemporary data-driven applications. This study investigates the impact of various oversampling techniques including SMOTE, Borderline-SMOTE, SVM-SMOTE, SMOTE-ENN, KMeans-SMOTE, SMOTE-Tomek, and ADASYN on the performance of classification models. The classifiers employed in this evaluation are Logistic Regression (LR), Random Forest (RF), Support Vector Machines (SVM), and XGBoost (XGB). The models' performances were assessed based on widely used evaluation metrics, including Precision, Recall, F1-score, ROC curve and AUC value. The comparisons were conducted between oversampling techniques and classification algorithms to determine the most effective combinations. In the final phase of the study, a single best-performing classifier was selected for each oversampling method, followed by a comparative analysis to identify the overall most successful pair. The experimental results demonstrate that the combination of the SMOTE-ENN oversampling technique and the RF classifier yields the highest performance across the considered evaluation metrics, indicating it as the most effective pairs for handling imbalanced datasets in this context.
dc.description.ozetDengesiz sınıflı veri problemi günümüzde sınıflandırma algoritmalarının kullanımını sınırlandıran en büyük problemlerden biridir. Bu çalışma kapsamında aşırı örnekleme tekniği olarak temel SMOTE, Borderline-SMOTE, SVM-SMOTE, SMOTE-ENN, KMeans-SMOTE, SMOTETomek ve ADASYN algoritmaları ve sınıflandırma algoritması olarak lojistik regresyon (LR), rastgele ormanlar (RF), destek vektör makineleri (SVM) ve XGBoost (XGB) algoritmaları kullanılmıştır. Sınıflandırma performansları Kesinlik, Duyarlılık, F1 skoru, ROC eğrisi ve AUC değeri gibi ölçütler üzerinden karşılaştırılmış ve hangi ikilinin sınıflandırmada daha başarılı sonuçlar araştırılmıştır. Çalışmada bahsedilen performans ölçütleri kullanılarak ikili olarak performansları test edilmiş ve son bölümde her aşırı örnekleme algoritması için bir sınıflandırma algoritması seçilecek karşılaştırma yapılmış ve en verimli ikilinin ortaya çıkarılması amaçlanmıştır. Yapılan karşılaştırmaların sonucu olarak en yüksek performansa sahip ikili olarak, SMOTE-ENN aşırı örnekleme algoritması ve sınıflandırma algoritması olarak RF algoritması ikilisinin birlikte kullanımının en başarılı sınıflandırma yapan ikili olduğu gösterilmiştir.
dc.embargo.lift2026-06-02T12:07:02Z
dc.embargo.termsAcik erisim
dc.identifier.urihttps://hdl.handle.net/11655/38565
dc.language.isotr
dc.publisherFen Bilimleri Enstitüsü
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectSınıflandırma
dc.subjectAşırı örnekleme
dc.subjectModel
dc.subjectSimülasyon
dc.subjectDengesiz veri
dc.titleDengesiz Verilerde Sentetik Azınlık Aşırı Örnek Tekniklerinin (Smote) Karşılaştırılması: İnme Verisi Örneği
dc.title.alternativeComparison Of Synthetic Minorıty Oversampling Techniques (Smote) On Imbalanced Data: The Stroke Data Example
dc.typeinfo:eu-repo/semantics/masterThesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
10646526.pdf
Size:
2.17 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.89 KB
Format:
Item-specific license agreed upon to submission
Description: