dc.contributor.advisor | Adalı, Tuğba | |
dc.contributor.author | Öztürk, Cansu | |
dc.date.accessioned | 2020-07-02T13:55:23Z | |
dc.date.issued | 2019-11-15 | |
dc.date.submitted | 2019-09-17 | |
dc.identifier.citation | APA | tr_TR |
dc.identifier.uri | http://hdl.handle.net/11655/22381 | |
dc.description.abstract | The use of administrative registers and sample surveys together in estimation process has a significant effect on increasing the accuracy of statistical information and reducing the response burden, time, cost and labour. However, this requires integration of data sources.
Record linkage and statistical matching are two techniques improved for data integration. Record linkage is a method used when there is a perfect agreement between indicators. If there is no such variable in the data set but there are some common variables and samples of the surveys refer to same target population then statistical matching is used. Common variables between surveys are used as matching variables and fused data sets are obtained using different matching approaches such as parametric, non-parametric and mixed.
Aim of this dissertation was to apply different non-parametric statistical matching methods on household based sample surveys and compare their results regarding similarity of variables’ distributions. 2014-2015 Time Use Survey of Turkey and 2014 Life Satisfaction Survey of Turkey were used in the implementation. Three non-parametric hot deck methods named as nearest neighbour distance, random and rank hot deck were used in the matching with their constrained and unconstrained versions. For each method, fused data sets were obtained using four different combinations of matching variables and four target variables. Comparisons were made both between methods, and within methods; through changes in applications for each specific method.
It was found that results vary according to both matching variables and target variables. Moreover, contrary to expectations, constrained hot deck did not provide better result. | tr_TR |
dc.language.iso | en | tr_TR |
dc.publisher | Nüfus Etütleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | * |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
dc.subject | Statistical matching | tr_TR |
dc.subject | Non-parametric hot deck | tr_TR |
dc.subject | Constrained and unconstrained hot deck | tr_TR |
dc.subject.lcsh | İstatistikler | tr_TR |
dc.title | Nonparametrıc Statıstıcal Matchıng Methods: An Applıcatıon On Household Surveys In Turkey | tr_TR |
dc.type | info:eu-repo/semantics/masterThesis | tr_TR |
dc.description.ozet | İdari kayıtların ve örneklem araştırmalarının tahmin sürecinde birlikte kullanılması, istatistiki bilgilerin doğruluğunu arttırmakla beraber cevaplayıcı yükünü, zamanı, maliyeti ve işgücünü azaltmada önemli bir etkiye sahiptir. Ancak, bu yöntem farklı veri kaynaklarının birleştirilmesini gerektirmektedir.
Kayıt bağlama ve istatistiksel eşleştirme, veri birleştirme için geliştirilmiş iki tekniktir. Kayıt bağlama, veride birebir eşleştirme sağlayan eşsiz bir değişken olduğu zaman kullanılan yöntemdir. Veri setinde böyle bir değişken yoksa fakat bazı ortak değişkenler varsa ve araştırmaların hedef kitleleri aynı ise, istatistiksel eşleştirme yöntemi kullanılmaktadır. Araştırmalar arasındaki ortak değişkenler eşleştirme değişkenleri olarak kullanılmakta ve birleşik veri setleri parametrik, parametrik olmayan ve karma gibi farklı eşleştirme yaklaşımları kullanılarak elde edilmektedir.
Tezde, hanehalkı bazlı örneklem araştırmalarında farklı parametrik olmayan istatistiksel eşleştirme yöntemlerinin kullanılması ve değişkenlerin dağılımlarının benzerliği kullanılarak sonuçların karşılaştırılması amaçlanmıştır. Uygulamada, 2014-2015 Türkiye Zaman Kullanımı Araştırması ve 2014 Türkiye Yaşam Memnuniyeti Araştırması kullanılmıştır. En yakın komşu, rastgele ve sıralıhot deck yöntemleri olmak üzere üç tane parametrik olmayan istatistiksel eşleştirme yöntemi, kısıtlıve kısıtlı olmayan seçenekleri ile kullanılmıştır. Kullanılan tüm yöntemlerde, birleştirilmiş veri setleri eşleştirme değişkenlerin 4 farklı kombinasyonu ve dört hedef değişken kullanılarak elde edilmiştir. Her yöntem için farklı uygulamalar yapıldığından hem yöntemlerin kendi içinde, hem de yöntemler arasında karşılaştırmalar yapılmıştır.
Sonuçların hem eşleştirme değişkenlerine hem de hedef değişkenlere göre değiştiği tespit edilmiştir. Ayrıca, beklentilerin aksine, kısıtlı seçeneği kullanılarak gerçekleştirilen eşleştirmenin daha iyi bir sonuç vermediği gözlemlenmiştir. | tr_TR |
dc.contributor.department | Sosyal Araştırma Yöntemleri | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | 2020-07-02T13:55:23Z | |
dc.funding | Yok | tr_TR |
dc.subtype | proficiencyinart | tr_TR |