Abstract
In today’ s conditions, increasing the need for such as assessing, analyzing and making forward estimates of data, has increased the demand for data mining methods.
In this study, classification and regression estimating methods of data mining are discussed, C5.0 decision tree, CHAID decision tree, Logistic Regression and Bayesian Networks methods are examined and the modeling successes were compared by applying them on a real data set.
Additionally, data on the Household Labor Force Survey compiled and implemented by Turkish Statistical Institute for 2014, 2015 and 2016 years. Also, within the scope of this study to determine the labor situation in Turkey, both the employed labor force status by making regarding the classification of individuals outside employment profile is intended to be an accurate estimate of the labor situation as a result of unknown individual models.
When the study results were evaluated, it was calculated that the model obtained as a result of the C5.0 decision tree method had the most successful classification prediction even though the model successes were relatively close to each other in comparison with various criteria.
xmlui.mirage2.itemSummaryView.Collections
xmlui.dri2xhtml.METS-1.0.item-citation
[1] Kara Ö.S., Lojistik Regresyon Analizi Ve Kadın İşgücü Üzerine Bir Uygulama, Yüksek Lisans Tezi, Uludağ Üniversitesi Sosyal Bilimler Enstitüsü İstatistik Bilim Dalı, Bursa, 2015
[2] Altunkaya H.İ., Ülkelerin Uzun Dönem Kredi Notlarının Derecelendirilmesinde Önemli Değişkenlerin Veri Madenciliği Teknikleri Kullanılarak Belirlenmesi, Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı, Ankara, 2013
[3] Kocabaş F.M., Veri Madenciliği Süreci ve Gerçek Bir Veri Seti Üzerinde Uygulanması, Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı, Ankara, 2010
[4] Yılmaz E., İstatiksel Analiz Yöntemi Olarak Veri Madenciliğinde CHAID Algoritması Ve Türkiye’de İşgücü Piyasasının Durumunun ve Bunun Nedenlerinin Belirlenmesine İlişkin Bir Uygulama, Yüksek Lisans Tezi, Yıldız Teknik Üniversitesi Sosyal Bilimler Enstitüsü İşletme Ana Bilim Dalı İşletme Yönetimi Yüksek Lisans Programı, İstanbul, 2012
[5] Yakut E., Veri Madenciliği Tekniklerinden C5.0 Algoritması ve Destek Vektör Makineleri ile Yapay Sinir Ağlarının Sınıflandırma Başarılarının Karşılaştırılması: İmalat Sektöründe Bir Uygulama, Doktora Tezi, Atatürk Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı, Erzurum, 2012
[6] Kuzey C., Veri Madenciliğinde Destek Vektör Makinaları ve Karar Ağaçları Yöntemlerini Kullanarak Bilgi Çalışanlarının Kurum Performansı Üzerine Etkisinin Ölçülmesi ve Bir Uygulama, Doktora Tezi, İstanbul Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı Sayısal Yöntemler Bilim Dalı, İstanbul, 2012
[7] Çakır Ö., Veri Madenciliğinde Sınıflandırma Yöntemlerinin Karşılaştırılması “Bankacılık Müşteri Veri Tabanı Üzerinde Bir Uygulama”, Doktora Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı Sayısal Yöntemler Bilim Dalı, İstanbul, 2008
[8] Kıyak E., Crisp-Dm Yöntembilimi Kullanılarak Deniz Kuvvetleri Verisi Üzerinde Veri Madenciliği Sınıflandırma Tekniklerinin Karşılaştırılması, Yüksek Lisans Tezi, Kocaeli Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Kocaeli, 2006
[9] Özdemir A., Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği-Sağlık Sektöründe Uygulama, Doktora Tezi, Atatürk Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı, Erzurum, 2004
[10] Doğan K., Arslantekin S., Büyük Veri: Önemi, Yapısı ve Günümüzdeki Durum, DTCF Dergisi, 56.1, 15-36, 2016
[11] Dura C., Atik H. ,Bilgi Toplumu, Bilgi Ekonomisi ve Türkiye, İstanbul, Literatür Yayıncılık, 1.Baskı, 2002
[12] Han J., Kamber M., Data Mining: Concepts and Techniques, Second Edition, Morgan Kaufmann Publishers, 2nd Ed., San Francisco, USA, 2006
[13] Can M.B. vd., Veri kümelerinden bilgi keşfi: veri madenciliği, http://docplayer.biz.tr/14269227-Mehmet-berkay-can-eren-camur-mine-koru-omer-ozkan-zeynep-rzayeva.html (Şubat 2017)
[14] Özkan Y., Veri Madenciliği Yöntemleri, Papatya Yayıncılık Eğitim, 2008)
[15] Giudici P., Applied Data Mining, Statistical Methods for Business and Industry, Italy, 2003
[16] Karaca İ., Büyük Veri Analizlerinin Kurumsal Faaliyetlerde Kullanım Alanları, Lisans Tezi, Ankara Üniversitesi Dil ve Tarih-Coğrafya Fakültesi Bilgi ve Belge Yönetimi Bölümü Ankara, 2015
[17] Savaş S. vd., Veri Madenciliği ve Türkiye’deki Uygulama Örnekleri, Tarama makalesi, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 11-2, 2012
[18] Olson D.L., Delen D., Advanced Data Mining Techniques, Springer-Verlag Berlin Heidelberg, 2008
[19] Öğüt S., Veri Madenciliği Kavramı ve Gelişim Süreci. Yeditepe Üniversitesi, İstanbul, 2002, http://www.sertacogut.com/blog/wp-content/uploads/2009/03/sertac_ogut_-_veri_madenciligi_kavrami_ve_gelisim_sureci.pdf (Şubat, 2017)
[20] http://ugurozmen.com/crm/en-iyi-teklif-sss-3 (Şubat, 2017)
[21] Atılgan E., Karayollarında Meydana Gelen Trafik Kazalarının Karar Ağaçları ve Birliktelik Analizi ile İncelenmesi, Yüksek Lisans Tezi, Hacettepe Üniversitesi, İstatistik Bölümü, Ankara, 2011
[22] Albayrak A.S., Yılmaz Koltan Ş., Veri Madenciliği: Karar Ağacı Algoritması ve İMKB Verileri Üzerine Bir Uygulama, Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 14-1, 31-52, 2009
[23] Dolgun M.Ö., Büyük Alışveriş Merkezleri İçin Veri Madenciliği Uygulamaları, Yüksek Lisans Tezi, Hacettepe Üniversitesi İstatistik Anabilim Dalı, Ankara, 2006
[24] Gullo F., From Patterns in Data to Knowledge Discovery: What Data Mining Can Do, 3rd International Conference Frontiers in Diagnostic Technologies, ICFDT3 2013, Physics Procedia 62, 18-22, 2015
[25] Şentürk A., Veri Madenciliği Kavram ve Teknikler, Ekin Yayınevi, 2006
[26] Emel G.G., Taşkın Ç., Veri Madenciliğinde Karar Ağaçları ve Bir Satış Analizi Uygulaması, Eskişehir Osmangazi Üniversitesi Sosyal Bilimler Dergisi, 6-2, 221-239, 2005
[27] Ayık Y.Z. vd., Lise Türü ve Lise Mezuniyet Başarısının, Kazanılan Fakülte ile İlişkisinin Veri Madenciliği Tekniği ile Analizi”., Atatürk Üniversitesi , Sy.445,
http://docplayer.biz.tr/3976459-Lise-turu-ve-lise-mezuniyet-basarisinin-kazanilan-fakulte-ile-iliskisinin-veri-madenciligi-teknigi-ile-analizi.html (Mayıs, 2018)
[28] Witten I.A., Frank E., Data Mining Practical Machine LearningTools and Techniques, The Morgan Kaufmann Series in Data Management Systems, 2nd Ed., 2005
[29] Yohannes Y., Hoddinott J., Classıfıcatıon And Regressıon Trees: An Introductıon Technical Guide, International Food Policy Research Institute 2033 K Street, N.W. Washington, D.C. 2006 U.S.A., Mart 1999, S.2, https://www.researchgate.net/publication/242370834_Classification_and_Regression_Trees_An_Introduction (Nisan, 2018)
[30] Michie D., Machine Learning, Neural and Statistical Classification, Cambridge, U.K., 1994
[31] Berry M.J.A. , Linoff G.S., Data Mining Techniques for Marketing, Sales and Customer Relationship Management, Wiley Publishing, 2nd Ed., Indiana, 2004
[32] Doğan N., Özdamar K., CHAID Analizi ve Aile Planlaması ile ilgili Bir Uygulama, T Klin Tıp Bilimleri, 23, 392-397, 2003
[33] Kass GV., An Exploratory Technique For İnvestigating Large Quantities Of Categorical Data, Applied Statistics, 29-2, 119-127 , 1980
[34] Diaz-Perez F.M., Bethencourt-Cejas M., Chaid Algorithm As An Appropriate Analytical Method For Tourism Market Segmentation, Journal of Destination Marketing & Management, 5-3, 275–282, 2016
[35] Ritschard G., CHAID and Earlier Supervised Tree Methods , Dept of Econometrics, University of Geneva, Switzerland, 2010-02, 1-28, 2010
[36] Karakoyun M., Hacıbeyoğlu M., Biyomedikal Veri Kümeleri ile Makine Öğrenmesi Sınıflandırma Algoritmalarının İstatistiksel Olarak Karşılaştırılması, Dokuz Eylül Üniversitesi Mühendislik Fakültesi Mühendislik Bilimleri Dergisi, 16-48, 30-41, 2014
[37] Siyah B., Spor Metinleri Sınıflama Projesi, MKÜ Bilgisayar Mühendisliği Bölümü, S.1, http://www.bulentsiyah.com/naive-bayes-ile-spor-metinleri-siniflandirma/, (Nisan, 2017)
[38] Larose D.T., Data Mining Methods and Models, A John Wiley & Sons, Inc Publication, United States of America, 2006
[39] Murat N., Model Seçiminde Bayesci Yaklaşımların Kullanımı, Yüksek Lisans Tezi, Ondokuz Mayıs Üniversitesi Fen Bilimleri Enstitüsü İstatistik Ana Bilim Dalı, Samsun, 2007
[40] Aktaş C., Erkuş O., Lojistik Regresyon Analizi ile Eskişehir’in Sis Kestiriminin İncelenmesi, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 8-16, 47-59, 2009
[41] Önder H., Cebeci Z., Lojistik Regresyonlarda Değişken Seçimi, Çukurova Üniversitesi Ziraat Fakültesi Dergisi, 17 (2), 105-114, 2002
[42] Tatlıdil, H., Uygulamalı Çok Değişkenli İstatistiksel Analiz, Ziraat Matbaacılık, Ankara, 2002
[43] Kıran Z.B., Lojistik Regresyon ve Cart Analizi Teknikleriyle Sosyal Güvenlik Kurumu İlaç Provizyon Sistemi Verileri Üzerinde Bir Uygulama, Yüksek Lisans Tezi, İstatistik Gazi Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 2010
[44] Başarır G., Çok Değişkenli Verilerde Ayrımsama Sorunu ve Lojistik Regresyon Analizi, Doktora Tezi, Hacettepe Üniversitesi, İstatistik Bölümü, Ankara, 1990
[45] Hosmer D.W., Lemeshow S., Applied Logistics Regression, Wiley Series in Probability and Statistics, John Wiley & Sons, Inc. , 2nd Ed., 2000
[46] Ürük E., İstatistiksel Uygulamalarda Lojistik Regresyon Analizi, Yüksek Lisans Tezi, Marmara Üniversitesi Fen Bilimleri Enstitüsü, Matematik Anabilim Dalı Uygulamalı Matematik Programı, İstanbul, 2007
[47] Aladağ Ç.H. vd, Improving Weighted Information Criterion By Using Optimization, Journal of Computational and Applied Mathematics, 233-10, 2683-2687, 2010
[48] Bircan H., Lojistik Regresyon Analizi: Tıp Verileri Üzerine Bir Uygulama, Kocaeli Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 2, 185-208, 2004
[49] Aladağ Ç.H. vd., Forecasting Nonlinear Time Series With A Hybrid Methodology, Applied Mathematics Letters, 22-9, 1467-1470, 2009
[50] Coşkun C., Baykal A., Veri Madenciliğinde Sınıflandırma Algoritmalarının Bir Örnek Üzerinde Karşılaştırılması, Akademik Bilişim’11 - XIII. Akademik Bilişim Konferansı Bildirileri, Şubat 2011 İnönü Üniversitesi, Malatya, 51-58, 2011
[51] Dolgun M.Ö., Veri Madenciliği Sınıflama Yöntemlerinin Başarılarının; Bağımlı Değişken Prevelansı, Örneklem Büyüklüğü ve Bağımsız Değişkenler Arası İlişki Yapısına Göre Karşılaştırılması, Doktora Tezi, Hacettepe Üniversitesi Sağlık Bilimleri Enstitüsü, Ankara, 2014
[52] Akçayol M.A., Web Madenciliği (Web Mining) Ders Notları, Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü,
http://w3.gazi.edu.tr/~akcayol/files/WM_L5ClassifierEvaulation.pdf (Nisan, 2018)
[53] Powers D.M.W., Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness & Correlation, Journal of Machine Learning Technologies, 2-1, 51-58, 2011
[54] Beliner E., Müşteri İlişkileri Yönetiminde İstatistiğin Yeri ve Bir Uygulama, Yüksek Lisans Tezi, Hacettepe Üniversitesi İstatistik Anabilim Dalı, Ankara, 2015
[55] TÜİK web sayfası,
http://www.TÜİK.gov.tr/MicroVeri/HİA_2015/turkce/metaveri/tanim/index.html (Ocak, 2018)
[56] TÜİK web sayfası,
http://www.TÜİK.gov.tr/MicroVeri/HİA_2015/turkce/metaveri/tarihce/index.html (Ocak, 2018)
[57] Taş B., AB Uyum Sürecinde Türkiye İçin Yeni Bir Bölge Kavramı: İstatistiki Bölge Birimleri Sınıflandırması (İbbs), Afyon Kocatepe Üniversitesi Fen-Edebiyat Fakültesi Coğrafya Bölümü, 03200 Afyonkarahisar, Sosyal Bilimler Dergisi, 8-2, 185-198, 2006
[58] IBM web sayfası,
https://www.ibm.com/support/knowledgecenter/SS3RA7_15.0.0/com.ibm.spss.modeler.help/partition_settingstab.htm (Ocak, 2018)