T.C. HACETTEPE ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ PEDİATRİK BÜYÜME EĞRİLERİNİN MODEL PERFORMANSLARININ GAMLSS YÖNTEMİ İLE İNCELENMESİ VE KANTİL REGRESYON YÖNTEMİ İLE KARŞILAŞTIRILMASI Eda ÇAKMAK Biyoistatistik Programı DOKTORA TEZİ ANKARA 2023 T.C. HACETTEPE ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ PEDİATRİK BÜYÜME EĞRİLERİNİN MODEL PERFORMANSLARININ GAMLSS YÖNTEMİ İLE İNCELENMESİ VE KANTİL REGRESYON YÖNTEMİ İLE KARŞILAŞTIRILMASI Eda ÇAKMAK Biyoistatistik Programı DOKTORA TEZİ TEZ DANIŞMANI Prof. Dr. Pınar ÖZDEMİR ANKARA 2023 iii HACETTEPE ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ PEDİATRİK BÜYÜME EĞRİLERİNİN MODEL PERFORMANSLARININ GAMLSS YÖNTEMİ İLE İNCELENMESİ VE KANTİL REGRESYON YÖNTEMİ İLE KARŞILAŞTIRILMASI Eda ÇAKMAK Danışman: Prof. Dr. Pınar ÖZDEMİR Bu tez çalışması 21.06.2023 tarihinde jürimiz tarafından “Biyoistatistik Programı” nda doktora tezi olarak kabul edilmiştir. Jüri Başkanı: Prof. Dr. Mehtap AKÇİL OK Başkent Üniversitesi Üye: Prof. Dr. Erdem KARABULUT Hacettepe Üniversitesi Üye: Dr. Öğr. Üyesi Sevilay KARAHAN Hacettepe Üniversitesi Üye: Dr. Öğr. Üyesi Osman DAĞ Hacettepe Üniversitesi Üye: Dr. Öğr. Üyesi Ayhan PARMAKSIZ İstanbul Sağlık ve Teknoloji Üniversitesi Bu tez, Hacettepe Üniversitesi Lisansüstü Eğitim-Öğretim ve Sınav Yönetmeliğinin ilgili maddeleri uyarınca yukarıdaki jüri tarafından uygun bulunmuştur. Prof. Dr. Müge YEMİŞCİ ÖZKAN Enstitü Müdürü iv YAYIMLAMA VE FİKRİ MÜLKİYET HAKLARI BEYANI Enstitü tarafından onaylanan lisansüstü tezimin/raporumun tamamını veya herhangi bir kısmını, basılı (kağıt) ve elektronik formatta arşivleme ve aşağıda verilen koşullarla kullanıma açma iznini Hacettepe Üniversitesine verdiğimi bildiririm. Bu izinle Üniversiteye verilen kullanım hakları dışındaki tüm fikri mülkiyet haklarım bende kalacak, tezimin tamamının ya da bir bölümünün gelecekteki çalışmalarda (makale, kitap, lisans ve patent vb.) kullanım hakları bana ait olacaktır. Tezin kendi orijinal çalışmam olduğunu, başkalarının haklarını ihlal etmediğimi ve tezimin tek yetkili sahibi olduğumu beyan ve taahhüt ederim. Tezimde yer alan telif hakkı bulunan ve sahiplerinden yazılı izin alınarak kullanılması zorunlu metinlerin yazılı izin alınarak kullandığımı ve istenildiğinde suretlerini Üniversiteye teslim etmeyi taahhüt ederim. Yükseköğretim Kurulu tarafından yayınlanan “Lisansüstü Tezlerin Elektronik Ortamda Toplanması, Düzenlenmesi ve Erişime Açılmasına İlişkin Yönerge” kapsamında tezim aşağıda belirtilen koşullar haricinde YÖK Ulusal Tez Merkezi / H.Ü. Kütüphaneleri Açık Erişim Sisteminde erişime açılır. o Enstitü / Fakülte yönetim kurulu kararı ile tezimin erişime açılması mezuniyet tarihimden itibaren 2 yıl ertelenmiştir. (1) o Enstitü / Fakülte yönetim kurulunun gerekçeli kararı ile tezimin erişime açılması mezuniyet tarihimden itibaren … ay ertelenmiştir. (2) o Tezimle ilgili gizlilik kararı verilmiştir. (3) 21/06/2023 Eda ÇAKMAK i -------------------------------------- i“Lisansüstü Tezlerin Elektronik Ortamda Toplanması, Düzenlenmesi ve Erişime Açılmasına İlişkin Yönerge” (1) Madde 6.1. Lisansüstü tezle ilgili patent başvurusu yapılması veya patent alma sürecinin devam etmesi durumunda, tez danışmanının önerisi ve enstitü anabilim dalının uygun görüşü üzerine enstitü veya fakülte yönetim kurulu iki yıl süre ile tezin erişime açılmasının ertelenmesine karar verebilir. (2) Madde 6.2. Yeni teknik, materyal ve metotların kullanıldığı, henüz makaleye dönüşmemiş veya patent gibi yöntemlerle korunmamış ve internetten paylaşılması durumunda 3. Şahıslara veya kurumlara haksız kazanç imkanı oluşturabilecek bilgi ve bulguları içeren tezler hakkında tez danışmanının önerisi ve enstitü anabilim dalının uygun görüşü üzerine enstitü veya fakülte yönetim kurulunun gerekçeli kararı ile altı ayı aşmamak üzere tezin erişime açılması engellenebilir. (3) Madde 7.1. Ulusal çıkarları veya güvenliği ilgilendiren, emniyet, istihbarat, savunma ve güvenlik, sağlık vb. konulara ilişkin lisansüstü tezlerle ilgili gizlilik kararı, tezin yapıldığı kurum tarafından verilir *. Kurum ve kuruluşlarla yapılan işbirliği protokolü çerçevesinde hazırlanan lisansüstü tezlere ilişkin gizlilik kararı ise, ilgili kurum ve kuruluşun önerisi ile enstitü veya fakültenin uygun görüşü üzerine üniversite yönetim kurulu tarafından verilir. Gizlilik kararı verilen tezler Yükseköğretim Kuruluna bildirilir. Madde 7.2. Gizlilik kararı verilen tezler gizlilik süresince enstitü veya fakülte tarafından gizlilik kuralları çerçevesinde muhafaza edilir, gizlilik kararının kaldırılması halinde Tez Otomasyon Sistemine yüklenir. * Tez danışmanının önerisi ve enstitü anabilim dalının uygun görüşü üzerine enstitü veya fakülte yönetim kurulu tarafından karar verilir. v ETİK BEYAN Bu çalışmadaki bütün bilgi ve belgeleri akademik kurullar çerçevesinde elde ettiğimi, görsel, işitsel ve yazılı tüm bilgi ve sonuçları bilimsel ahlak kurallarına uygun olarak sunduğumu, kullandığım verilerde herhangi bir tahrifat yapmadığımı, yararlandığım kaynaklara bilimsel normlara uygun olarak atıfta bulunduğumu, tezimin kaynak gösterilen durumlar dışında özgün olduğunu, Prof. Dr. Ergun Karaağaoğlu ve Prof. Dr. Pınar ÖZDEMİR danışmanlığında tarafımdan üretildiğini ve Hacettepe Üniversitesi Sağlık Bilimleri Enstitüsü Tez Yazım Yönergesine göre yazıldığını beyan ederim. Eda ÇAKMAK vi TEŞEKKÜR Doktora eğitimime başladığım ilk günden bu yana dört yıl süresince tez danışmanlığımı yürüten, akademik tecrübeleriyle beni yönlendiren, her soruma kısa sürede geri dönüş sağlayan, tezime ve makaleme katkılarını esirgemeyen saygıdeğer hocam Prof. Dr. Ergun Karaağaoğlu’na sonsuz teşekkürlerimi borç bilirim. Doktora tez sürecimin son zamanlarında tez danışmanlığımı yürüten değerli hocam Biyoistatistik Anabilim Dalı Başkanı Prof. Dr. Pınar Özdemir’e tezime katkılarından dolayı ve kararsız olduğum zamanlarda beni cesaretlendirdiği ve her zaman yanımda desteğini hissettirdiği için teşekkürlerimi sunarım. Benim için hayatımdaki yerini bu sayfalara anlatamayacağım kadar değerli hocam Prof. Dr. Mehtap Akçil Ok’a hayatımın her anındaki tüm dokunuşları için sonsuz teşekkürlerimi sunarım. Lisans eğitimime başladığım günden bu yana her anımı paylaştığım ve her zaman her konuda bana destek olan hocama teşekkürlerimi sunarım. Tez savunmasında yer alan ve ders aldığım Hacettepe Üniversitesi Biyoistatistik Anabilim Dalı saygıdeğer hocalarına ve her zaman her konuda tüm işlerimi kolaylaştıran anabilim dalı sekreterimiz Menekşe Tarla’ya teşekkürlerimi sunarım. Başkent Üniversitesi Odyoloji Ailesi; Dr. Öğr. Ü. Asuman Alnıaçık, Dr. Öğr. Ü. Kübra Özmen, Öğr. Gör. Dr. Merve Deniz Sakarya ve Odyoloji Bölümündeki değerli çalışma arkadaşlarım her zorluğa birlikte göğüs gerdiğimiz ve keyifli çalışma ortamımız için her birinize teşekkür ederim. Bu tez çalışmasında hastane verilerine erişimim konusunda bana her imkanı sunan ve çok hızlı bir şekilde tüm sorularıma çözüm bulan Başkent Üniversitesi Ankara Hastanesi Bilgi İşlem Daire Başkanlığı’na ve Başkent Üniversitesi Bilgi İşlem Daire Başkanlığı’na ve tez verilerim için Dr. Serhat Kılıç’a teşekkür ederim. Ve buralara kadar gelmemdeki en büyük role sahip sevgili ailem, her türlü maddi manevi fedakarlıklarınız ve bana öğrettiğiniz her şey için sonsuz teşekkür ederim. vii ÖZET Çakmak, E., Pediatrik Büyüme Eğrilerinin Model Performanslarının GAMLSS Yöntemi İle İncelenmesi ve Kantil Regresyon Yöntemi İle Karşılaştırılması, Hacettepe Üniversitesi Sağlık Bilimleri Enstitüsü Biyoistatistik Programı Doktora Tezi, Ankara, 2023. Bir çocuğun büyüme ve gelişiminin incelenmesinde, hastalık durumunun erken tanılanmasında, beslenme durumunun değerlendirilmesinde en iyi araçlardan biri antropometrik ölçümler yardımıyla oluşturulan referans pediatrik büyüme eğrileridir. Bu tez kapsamında cinsiyete göre boy uzunluğu, vücut ağırlığı, baş çevresi ve beden kitle indeksi ölçümlerine ilişkin büyüme eğrileri farklı istatistiksel yöntemler ile oluşturulmuştur. LMS, LMSP ve LMST yöntemlerinin bir arada kullanılarak geliştirildiği GAMLSS (Generalized additive model for location, scale and shape) modeli ile kantil regresyon yöntemi sonucunda elde edilen büyüme eğrileri karşılaştırılmıştır. Her iki yöntem sonucunda büyüme eğrilerinin veriye uyumu ve model yeterliği worm grafiği ile incelenmiştir. Büyüme eğrilerinin oluşturulmasında LMSP ve LMST yöntemlerinin LMS yöntemine göre farkı, dağılımın çarpıklığını ve basıklığını dikkate almasıdır. GAMLSS modeli veride normal dağılım varsayımı gerektirirken, aynı zamanda büyüme eğrilerinin model performanslarını inceleyerek en uygun model seçimine olanak sağlamaktadır. Kantil regresyon ise veride herhangi bir dağılım varsayımı gerektirmediğinden, büyüme eğrilerinin oluşturulmasında alternatif bir yöntemdir. Bulgulara göre, GAMLSS yöntemi sonucunda daha düzleştirilmiş esnek büyüme eğrilerinin elde edildiği gözlenmiştir, fakat burada modelde etkili serbestlik derecesinin belirlenmesi oldukça önemlidir. Kantil regresyon yönteminde ise düzleştirme parametresinin seçimi oldukça önemli olup monotonluk kısıtlamaları ile esnek büyüme eğrileri oluşturulmuştur, fakat bazı antropometrik ölçümler için eğrinin uç noktalarında esnekliğin bozulduğu gözlenmiştir. Her iki yöntem sonucunda da tüm yaş grubunu içeren worm grafiklerinde wormlar %95 güven aralığında yer almaktadır. Oluşturulan büyüme eğrilerinin veriye uyumunun yeterli olduğu söylenebilmektedir. Anahtar Kelimeler: Büyüme eğrileri, GAMLSS, kantil regresyon, worm grafiği viii ABSTRACT Çakmak, E., Evaluation of Model Performances of Pediatric Growth Curves with GAMLSS Method and Comparison with Quantile Regression Method, Hacettepe University Graduate School Health Sciences Doctor of Philosophy Thesis in Biostatistics, Ankara, 2023. Reference pediatric growth curves constructed with the help of anthropometric measurements are one of the best tools in the examination of a child's growth and development, in the early diagnosis of disease status and in the evaluation of nutritional status. Within the scope of this thesis, growth curves for height, body weight, head circumference and body mass index measurements by gender were constructed with different statistical methods. The growth curves obtained as a result of the quantile regression method were compared with the GAMLSS (Generalized additive model for location, scale and shape) model, which was developed by using LMS, LMSP and LMST methods together. As a result of both methods, the fit of the growth curves to the data and the model adequacy were assessed with the worm plot. The difference between the LMSP and LMST methods compared to the LMS method is to take into account the skewness and kurtosis of the distribution while constructing the growth curves. While the GAMLSS model requires the assumption of normal distribution in the data, it also enables the best model selection by examining the model performances of the growth curves. On the other hand, quantile regression is an alternative method for constructing growth curves since it does not require any distribution assumption in the data. According to the results, it was observed that more smoothed flexible growth curves were obtained as a result of the GAMLSS method, but it is very important to determine the effective degrees of freedom in the model. In the quantile regression method determination of the smoothing parameter is very important and flexible growth curves were constructed with monotony restrictions, but for some anthropometric measurements it was observed that the flexibility was impaired at the end values of the curve. As a result of both methods worms are in the 95% confidence interval in the worm plot containing all age groups. It can be said that the fit of the constructed growth curves to the data is sufficient. Key Words: Growth curve, GAMLSS, quantile regression, worm plot ix İÇİNDEKİLER ONAY SAYFASI iii YAYIMLAMA VE FİKRİ MÜLKİYET HAKLARI BEYANI iv ETİK BEYAN v TEŞEKKÜR vi ÖZET vii ABSTRACT viii İÇİNDEKİLER ix SİMGELER VE KISALTMALAR xii ŞEKİLLER xiii TABLOLAR xvi 1. GİRİŞ 1 2. GENEL BİLGİLER 4 2.1. Büyüme Eğrilerinin Tarihsel Gelişimi 4 2.2. LMS Yöntemi 6 2.3. Düzleştirme (Smoothing) 11 2.3.1. Spline 12 2.4. Z-skoru ve Persentil 15 2.5. GAMLSS Modelinin Geliştirilmesi 17 2.5.1. Doğrusal Model (Linear Model) 17 2.5.2. Genelleştirilmiş Doğrusal Model (Generalized Linear Model) 18 2.5.3. Genelleştirilmiş Toplamsal Model (Generalized Additive Model) 20 2.5.4. GAMLSS Modeli (Generalized Additive Models for Location, Scale and Shape) 20 2.6. LMSP ve LMST Yöntemleri 23 2.6.1. BCPE ve BCT Dağılımları 23 2.7. Worm Grafiği (Worm Plot) 26 2.8. Kantil Regresyon (Quantile Regression) Yöntemi 29 x 2.8.1. Doğrusal Kantil Regresyon Modeli 31 2.8.2. Doğrusal Olmayan Kantil Regresyon Modeli 31 2.8.3. Cezalandırılmış Spline’lar İle Parametrik Olmayan Kantil Regresyon 32 2.8.4. P-spline Kullanımı İle En Küçük Kareler Regresyon Yöntemi 33 2.8.5. P-spline Kullanımı İle Kantil Regresyon Yöntemi 34 2.8.6. Kesişmeyen ve Monoton Kantil Eğrilerinin Tahmini 36 2.8.7. Kesişmeyen (Non-crossing) Kantil Eğrilerinin Tahmini 37 2.8.8. Monoton Kantil Eğrilerinin Tahmini 38 2.8.9. Kantil Regresyonda Düzleştirme Parametresinin Seçimi 39 3. GEREÇ VE YÖNTEM 41 3.1. Örneklem Sayısının Belirlenmesi 41 3.2. Örneklemin Özellikleri 41 3.3. GAMLSS Model Seçimi 42 3.4. Gerçek Veride Model Seçimi 43 3.5. Model Yeterliğinin İncelenmesi 43 3.6. Kantil Regresyonda Eğrilerin Oluşturulması 44 3.7. İstatistiksel Yazılım 45 4. BULGULAR 47 4.1. Antropometrik Ölçümlerin Tanımlayıcı İstatistikleri 47 4.2. Antropometrik Ölçümlerin LMS Yöntemine Göre Persentil Değerleri ve Z-Skorları Sonuçları 52 4.3. Antropometrik Ölçümlerin GAMLSS Model Performansları 69 4.4. Antropometrik Ölçümlerin GAMLSS Yöntemine Göre Büyüme Eğrileri 70 4.5. Antropometrik Ölçümlerin Kantil Regresyon Yöntemine Göre Kantil Değerleri 78 4.6. Antropometrik Ölçümlerin Kantil Regresyon Yöntemine Göre Büyüme Eğrileri 83 4.7. Antropometrik Ölçümlerin GAMLSS ve Kantil Regresyon Yöntemine Göre Büyüme Eğrilerinin Karşılaştırılması 91 4.8. Antropometrik Ölçümlerin GAMLSS Yöntemine Göre Worm Grafikleri 99 4.9. Antropometrik Ölçümlerin Kantil Regresyon Yöntemine Göre Worm Grafikleri 107 5. TARTIŞMA 115 xi 6. SONUÇ VE ÖNERİLER 119 7. KAYNAKLAR 120 8. EKLER 124 EK – 1: Etik Kurul İzni EK – 2: Doktora Tez Çalışması Turnitin Dijital Makbuz EK – 3: Doktora Tez Çalışması Orijinallik Raporu 9. ÖZGEÇMİŞ 127 xii SİMGELER VE KISALTMALAR AIC BCCG BCPE BCT BKİ DSÖ GAIC GAMLSS LMS SBC / SIC Akaike bilgi kriteri Box-Cox Cole Green Box-Cox Power Exponential Box-Cox t Beden Kitle İndeksi Dünya Sağlık Örgütü Genelleştirilmiş Akaike bilgi kriteri Konum, ölçek ve şekil için genelleştirilmiş toplamsal modeller Lambda, Mu, Sigma Schwartz bilgi kriteri xiii ŞEKİLLER Şekil Sayfa 2.1. Düzleştirilmemiş boy uzunluğu ve vücut ağırlığı büyüme eğrileri 12 2.2. a=1, b=3, c=5 düğümleri ile doğrusal spline fonksiyonu 13 2.3. B-spline grafikleri 14 2.4. BCPE dağılımının farklı değerleri için dağılım grafikleri 24 2.5. Worm grafiğinin model uyumunun incelenmesi 28 2.6. Düzleştirme parametresinin farklı değerlerinde baş çevresi için büyüme eğrileri 40 3.1. Boy uzunluğu verisi için düzleştirme parametresinin seçiminde çapraz geçerlik skorları grafiği ve uydurulan büyüme eğrisi 45 4.1. GAMLSS yöntemine göre kız çocuklarının boy uzunluğu büyüme eğrileri 70 4.2. GAMLSS yöntemine göre kız çocuklarının vücut ağırlığı büyüme eğrileri 71 4.3. GAMLSS yöntemine göre kız çocuklarının baş çevresi büyüme eğrileri 72 4.4. GAMLSS yöntemine göre kız çocuklarının beden kitle indeksi büyüme eğrileri 73 4.5. GAMLSS yöntemine göre erkek çocuklarının boy uzunluğu büyüme eğrileri 74 4.6. GAMLSS yöntemine göre erkek çocuklarının vücut ağırlığı büyüme eğrileri 75 4.7. GAMLSS yöntemine göre erkek çocuklarının baş çevresi büyüme eğrileri 76 4.8. GAMLSS yöntemine göre erkek çocuklarının beden kitle indeksi büyüme eğrileri 77 4.9. Kantil regresyon yöntemine göre kız çocuklarının boy uzunluğu büyüme eğrileri 83 4.10. Kantil regresyon yöntemine göre kız çocuklarının vücut ağırlığı büyüme eğrileri 84 4.11. Kantil regresyon yöntemine göre kız çocuklarının baş çevresi büyüme eğrileri 85 4.12. Kantil regresyon yöntemine göre kız çocuklarının beden kitle indeksi büyüme eğrileri 86 4.13. Kantil regresyon yöntemine göre erkek çocuklarının boy uzunluğu büyüme eğrileri 87 xiv Şekil Sayfa 4.14. Kantil regresyon yöntemine göre erkek çocuklarının vücut ağırlığı büyüme eğrileri 88 4.15. Kantil regresyon yöntemine göre erkek çocuklarının baş çevresi büyüme eğrileri 89 4.16. Kantil regresyon yöntemine göre erkek çocuklarının beden kitle indeksi büyüme eğrileri 90 4.17. GAMLSS ve Kantil Regresyon yöntemine göre kız çocuklarının boy uzunluğu büyüme eğrilerinin karşılaştırılması 91 4.18. GAMLSS ve Kantil Regresyon yöntemine göre kız çocuklarının vücut ağırlığı büyüme eğrilerinin karşılaştırılması 92 4.19. GAMLSS ve Kantil Regresyon yöntemine göre kız çocuklarının baş çevresi büyüme eğrilerinin karşılaştırılması 93 4.20. GAMLSS ve Kantil Regresyon yöntemine göre kız çocuklarının beden kitle indeksi büyüme eğrilerinin karşılaştırılması 94 4.21. GAMLSS ve Kantil Regresyon yöntemine göre erkek çocuklarının boy uzunluğu büyüme eğrilerinin karşılaştırılması 95 4.22. GAMLSS ve Kantil Regresyon yöntemine göre erkek çocuklarının vücut ağırlığı büyüme eğrilerinin karşılaştırılması 96 4.23. GAMLSS ve Kantil Regresyon yöntemine göre erkek çocuklarının baş çevresi büyüme eğrilerinin karşılaştırılması 97 4.24. GAMLSS ve Kantil Regresyon yöntemine göre erkek çocuklarının beden kitle indeksi büyüme eğrilerinin karşılaştırılması 98 4.25. GAMLSS yöntemine göre kız çocuklarının boy uzunluğu için worm grafiği 99 4.26. GAMLSS yöntemine göre kız çocuklarının vücut ağırlığı için worm grafiği 100 4.27. GAMLSS yöntemine göre kız çocuklarının baş çevresi için worm grafiği 101 4.28. GAMLSS yöntemine göre kız çocuklarının beden kitle indeksi için worm grafiği 102 4.29. GAMLSS yöntemine göre erkek çocuklarının boy uzunluğu için worm grafiği 103 4.30. GAMLSS yöntemine göre erkek çocuklarının vücut ağırlığı için worm grafiği 104 4.31. GAMLSS yöntemine göre erkek çocuklarının baş çevresi için worm grafiği 105 4.32. GAMLSS yöntemine göre erkek çocuklarının beden kitle indeksi için worm grafiği 106 xv Şekil Sayfa 4.33. Kantil regresyon yöntemine göre kız çocuklarının boy uzunluğu için worm grafiği 107 4.34. Kantil regresyon yöntemine göre kız çocuklarının vücut ağırlığı için worm grafiği 108 4.35. Kantil regresyon yöntemine göre kız çocuklarının baş çevresi için worm grafiği 109 4.36. Kantil regresyon yöntemine göre kız çocuklarının beden kitle indeksi için worm grafiği 110 4.37. Kantil regresyon yöntemine göre erkek çocuklarının boy uzunluğu için worm grafiği 111 4.38. Kantil regresyon yöntemine göre erkek çocuklarının vücut ağırlığı için worm grafiği 112 4.39. Kantil regresyon yöntemine göre erkek çocuklarının baş çevresi için worm grafiği 113 4.40. Kantil regresyon yöntemine göre erkek çocuklarının beden kitle indeksi için worm grafiği 114 xvi TABLOLAR Tablo Sayfa 2.1. Sık kullanılan persentillere karşılık gelen Z-skorları 16 2.2. Worm Grafiğinin Yorumlanması 29 4.1. Kız çocuklarının boy uzunluğu ve vücut ağırlığı tanımlayıcı istatistikleri 48 4.2. Kız çocuklarının beden kitle indeksi ve baş çevresi tanımlayıcı istatistikleri 49 4.3. Erkek çocuklarının boy uzunluğu ve vücut ağırlığı tanımlayıcı istatistikleri 50 4.4. Erkek çocuklarının beden kitle indeksi ve baş çevresi tanımlayıcı istatistikleri 51 4.5. LMS yöntemine göre 1-36 ay kız çocuklarının boy uzunluğu persentilleri 53 4.6. LMS yöntemine göre 1-36 ay kız çocuklarının vücut ağırlığı persentilleri 54 4.7. LMS yöntemine göre 1-24 ay kız çocuklarının baş çevresi persentilleri 55 4.8. LMS yöntemine göre 1-36 ay kız çocuklarının beden kitle indeksi persentilleri 56 4.9. LMS yöntemine göre 1-36 ay erkek çocuklarının boy uzunluğu persentilleri 57 4.10. LMS yöntemine göre 1-36 ay erkek çocuklarının vücut ağırlığı persentilleri 58 4.11. LMS yöntemine göre 1-24 ay erkek çocuklarının baş çevresi persentilleri 59 4.12. LMS yöntemine göre 1-36 ay erkek çocuklarının beden kitle indeksi persentilleri 60 4.13. LMS yöntemine göre 1-36 ay kız çocuklarının boy uzunluğu Z-skorları 61 4.14. LMS yöntemine göre 1-36 ay kız çocuklarının vücut ağırlığı Z-skorları 62 4.15. LMS yöntemine göre 1-24 ay kız çocuklarının baş çevresi Z-skorları 63 4.16. LMS yöntemine göre 1-36 ay kız çocuklarının beden kitle indeksi Z-skorları 64 4.17. LMS yöntemine göre 1-36 ay erkek çocuklarının boy uzunluğu Z-skorları 65 4.18. LMS yöntemine göre 1-36 ay erkek çocuklarının vücut ağırlığı Z-skorları 66 xvii Tablo Sayfa 4.19. LMS yöntemine göre 1-24 ay erkek çocuklarının baş çevresi Z-skorları 67 4.20. LMS yöntemine göre 1-36 ay erkek çocuklarının beden kitle indeksi Z-skorları 68 4.21. GAMLSS modeli dağılım parametreleri ve model performansları 69 4.22. Kantil regresyon yöntemine göre 1-36 ay kız çocuklarının boy uzunluğu kantilleri 79 4.23. Kantil regresyon yöntemine göre 1-36 ay kız çocuklarının vücut ağırlığı kantilleri 79 4.24. Kantil regresyon yöntemine göre 1-24 ay kız çocuklarının baş çevresi kantilleri 80 4.25. Kantil regresyon yöntemine göre 1-36 ay kız çocuklarının beden kitle indeksi kantilleri 80 4.26. Kantil regresyon yöntemine göre 1-36 ay erkek çocuklarının boy uzunluğu kantilleri 81 4.27. Kantil regresyon yöntemine göre 1-36 ay erkek çocuklarının vücut ağırlığı kantilleri 81 4.28. Kantil regresyon yöntemine göre 1-24 ay erkek çocuklarının baş çevresi kantilleri 82 4.29. Kantil regresyon yöntemine göre 1-36 ay erkek çocuklarının beden kitle indeksi kantilleri 82 1 1. GİRİŞ Bebeğin doğumdan itibaren büyüme evresinin izlenmesi sağlık durumundaki değişimi en iyi özetleyen göstergedir. Büyüme; bir çocuğun gelişiminde, hastalık durumunun erken tanılanmasında, beslenme durumunun değerlendirilmesinde önemli göstergelerden biridir. Çocukların büyüme evrelerinde boy uzunluğu, vücut ağırlığı, baş çevresi, beden kitle indeksi gibi elde edilen ölçümler antropometrik ölçümlerdir. Yaşa göre bu ölçümler ile çocukların sağlıklı gelişim süreci izlenmektedir (1). Çocukların fiziksel büyüme ve gelişiminin takibinde, klinik olarak değerlendirmenin ilk adımı çocuğun boy uzunluğu, vücut ağırlığı, baş çevresi gibi ölçümlerinin aynı yaş grubu ve cinsiyet için normal sınırlar içinde olup olmadığının incelenmesidir. Bir diğeri ise belirli yaş aralığına ve cinsiyete göre son bir yıldaki büyüme hızının normal sınırlar içinde olup olmadığının incelenmesidir (2). Çocuklarda büyümenin takibinde, büyüme referanslarından (growth references) ve büyüme çizelgelerinden (growth charts) yararlanılmaktadır. Büyüme referanslarının yanı sıra büyüme standartları (growth standards) kavramı da kullanılmaktadır. Büyüme standartları, dünyanın farklı bölgelerinde doğan çocukların belirli yaşa ve cinsiyete göre antropometrik ölçümlerine göre oluşturulan norm özelliğinde elde edilen değerlerdir. Bu standartlar uluslararası kullanım için amaçlanmış olup farklı popülasyonlardaki çocukların büyüme ve gelişiminin, beslenme durumunun takibine olanak sağlar. Büyüme referansları ise belirli bir bölgeyi temsil eden ve her toplumun kendi popülasyonu için belirli yaşa, cinsiyete ve antropometrik ölçümlerine göre elde edilen değerlerdir. Büyüme çizelgeleri, aynı yaştaki çocukların yaşa bağlı olarak büyümelerini değerlendirmek için kullanılan güçlü grafiksel yaklaşımlardır. Çocukların büyüme ve gelişimleri izlenirken, cinsiyete göre kendi yaş gruplarını içeren sağlıklı çocuklardan elde edilen referans büyüme eğrileri ile karşılaştırma yapılır (3-4). Büyüme çizelgelerinin kullanım amacı, gelişmiş veya gelişmekte olan ülkelerde çocukların büyümelerini takip etmede kullanılan görsel bir araç olup yaşla birlikte değişen antropometrik ölçümün dağılımını göstermektedir (5). Büyüme eğrileri oluşturulurken genetik faktörler, etnik köken, beslenme ve sosyo-ekonomik durum gibi büyümeyi etkileyen birçok etken düşünüldüğünde, her 2 toplumun kendine özgü tüm popülasyonu temsil eden büyüme eğrileri oluşturulmasına ihtiyaç duyulmuştur. Bir çocuğun sağlıklı büyüme süreci, topluma özgü oluşturulan referans büyüme değerleri ile cinsiyete bağlı olarak yaşa göre boy uzunluğu, vücut ağırlığı, baş çevresi gibi antropometrik ölçümler ile karşılaştırılarak incelenir (6). Bebeklerin ve çocukların büyüme evrelerinde antropometrik ölçümlerinin yaşa bağlı olarak artışı sabit olmadığından dolayı genelde çarpık bir dağılım göstermektedir. Pediatrik büyüme persentillerinin oluşturulmasında, Healy, Rasbash ve Yang büyüme standartlarını oluşturmak için parametrik olmayan persentillerin düzleştirilmesini ve polinom eğrileri ile uydurulmasını önermiştir. Çok esnek ve güçlü bir yöntem olduğunu belirtirken, dezavantaj olarak döneminde özel bir bilgisayar programı gerektirdiğini vurgulamışlardır. Van’t Hof, Wit ve Roede parametrik olmayan antropometrik ölçümler için her bir yaşta ölçümün Box-Cox kuvvet dönüşümü yardımıyla veride bir dönüşüm yaparak normal dağılıma yaklaşacağını önermiştir. Dönüşüm yapılan dağılımın normal olduğu varsayımında, ölçüm değişkenine ilişkin dağılımın ortalaması ve standart sapması yaşla birlikte düzleştirilmiş değiştirildiğinde persentil eğrilerinin de düzleştirilmiş elde edileceğini vurgulamışlardır. Cole ise Van’t Hof ve arkadaşlarının önerdiği yöntem üzerinden değişikliğe giderek LMS (lambda, mu, sigma) yöntemini geliştirmiştir (7). Sonrasında Cole ve Green (8) tarafından LMS yönteminde her bir L, M ve S eğrisi için düzleştirme parametreleri tanımlanarak büyüme eğrilerinin kestirimi sağlanmıştır. LMS yöntemi antropometrik ölçümün sadece çarpıklığını dikkate alırken, dağılımın hem çarpık hem de basık olduğu durum için Rigby ve Stasinopoulos (9-10) tarafından antropometrik ölçümün çarpıklığını ve basıklığını da modelleyebilen LMSP ve LMST yöntemleri geliştirilmiştir. Tüm bu yöntemlerin bir arada kullanılarak modellenebileceğini belirterek, konum ölçek ve şekil için genelleştirilmiş toplamsal model (GAMLSS - Generalized additive model for location, scale and shape) olarak adlandırmışlardır. Koenker ve Bassett (11) tarafından büyüme grafiklerinin oluşturulmasında veride dağılım varsayımının aranmadığı alternatif bir yöntem olarak kantil regresyon (quantile regression) yöntemi geliştirilmiştir. Worm grafiği (worm plot), büyüme eğrilerinde modelin veriye uyumunu değerlendirmede kullanılan görsel bir araçtır. Worm grafiği, Buuren 3 ve Fredriks (12) tarafından yaşa bağlı olarak uydurulan (fitting) büyüme eğrilerinde model seçiminde yardımcı bir grafiksel araç olarak geliştirilmiştir. Bu tez kapsamında, gerçek veri seti ile çocuklarda cinsiyete göre boy uzunluğu, vücut ağırlığı, baş çevresi ve beden kitle indeksi (BKİ) ölçümlerine ilişkin büyüme eğrilerinin değerlendirilmesi ve büyüme eğrilerinin oluşturulmasında kullanılan istatistiksel yöntemlerin model performanslarının karşılaştırılması amaçlanmaktadır. Bu bağlamda;  LMS yöntemine göre boy uzunluğu, vücut ağırlığı, baş çevresi ve BKİ ölçümlerinin cinsiyete göre persentil, Z-skoru değerleri ve kantil regresyon yöntemine göre ise kantil değerlerinin hesaplanması,  Dağılımın türü ve yapısına bağlı olarak büyüme eğrilerinin oluşturulmasında sık kullanılan GAMLSS modeli ile cinsiyete göre büyüme eğrilerinin ve model performanslarının karşılaştırılması,  Herhangi bir dağılım varsayımı gerektirmeyen ve büyüme eğrilerinin oluşturulmasında kullanılması önerilen kantil regresyon yöntemi ile cinsiyete göre büyüme eğrilerinin elde edilmesi ve GAMLSS modeli ile karşılaştırılması,  Uydurulan büyüme eğrilerinde model uyumsuzluklarını ve yanlılıkları saptamak amacıyla yaş gruplarına göre hem GAMLSS hem de kantil regresyon yöntemlerine göre worm grafiği ile incelenmesi amaçlanmıştır. 4 2. GENEL BİLGİLER 2.1. Büyüme Eğrilerinin Tarihsel Gelişimi Büyüme eğrileri ve büyüme persentilleri üzerine farklı bölgelerde kendi ülkelerini temsil eden popülasyon üzerinde, farklı yaş grupları ve çeşitli antropometrik ölçümler ile çok sayıda çalışma yürütülmüştür. Tarihte büyüme takibine ilişkin bilinen ilk çalışma 1759-1777 yılları arasında Count Philibert de Montbeillard’in oğlunu doğumundan 18 yaşına kadar her altı ayda bir boy uzunluğunu ölçmesi ile başlamıştır. Bu çalışma ile birlikte büyüme eğrileri üzerine farklı çalışmalar sunulmuştur (4). Tanner ve ark. tarafından 1966 yılında İngiliz çocuklarının büyüme standartları oluşturulmuştur. Cinsiyete göre boy uzunluğu ve vücut ağırlığı ölçümleri için büyüme persentilleri oluştururken yaşa göre bu ölçümler için büyüme hızını da değerlendirmişlerdir. Verilerinin büyük çoğunluğu 1954 yılı Londra’daki erkek ve kız çocuklarının ölçümleri iken, 1946-1954 yılları arasında Oxford’daki çocukların da ölçümleri yer almıştır. Doğumdan 5.5 yaşına kadar 80 çocuğun boy uzunluğu ve vücut ağırlığı ölçümleri Londra’daki Çocuk Çalışma Merkezi’nden (Child Study Centre in London) uzunlamasına takip edilmiştir. 5.5 yaşından 15.5 yaşına kadar olan veriler ise 1959 yılında London County Council araştırmasında rastgele seçilen Londra okullarındaki çocukların ölçümlerinden oluşmaktadır. Boy uzunluğu verisi için normal dağılım varsayımı altında her bir yaş için ortalama ve standart sapmadan persentilleri hesaplarken, vücut ağırlığı verisi dağılımı oldukça çarpık olduğundan dolayı ham veri üzerinde medyan ölçeklemesi ile enterpolasyon yaparak persentilleri hesaplamışlardır (2). Ulusal Sağlık İstatistikleri Merkezi (National Center for Health Statistics – NCHS) ve Dünya Sağlık Örgütü (DSÖ) (World Health Organization – WHO) tarafından boylamsal bir çalışma olarak Amerika Birleşik Devletleri’ndeki Avrupa kökenli çocukların 3 yaşına kadar olan ölçümleri ile büyüme referansları oluşturulmuştur. Çocukların her 3 ayda bir ölçülmesi, bebeklik dönemindeki hızlı değişimi iyi tanımlayamadığından ve büyüme eğrilerinin oluşturulmasında kullanılan istatistiksel yöntemlerin eksik yönleri olduğundan dolayı, bu oluşturulan referans 5 değerleri büyümeyi yeterince temsil edememiştir. Bu referansı oluşturan veriler 1929-1975 yılları arasını kapsadığından, bebeklerin beslenme ihtiyacından kaynaklı değişime bağlı olarak, bu referansların büyümeyi yeterince iyi tanımlamadığı vurgulanmıştır. Çocukların sağlık ve beslenme durumunu nüfusa dayalı olarak takip etmede referansların yeterli olmadığı ve sadece karşılaştırma görevini sağladığı düşüncesiyle büyüme standartlarının oluşturulması gerektiğini vurgulamışlardır. Böylelikle büyüme standartları, çocuklardaki büyümenin hem karşılaştırması hem de genel büyümelerini takip eden bir değerlendirme aracı olarak görülmektedir (13). Bilinen popüler çalışmalardan biri de Dördüncü Hollanda Büyüme Çalışmasıdır. Bu çalışmanın amacı 1980 büyüme referanslarını güncellemek olup 0- 21 yaş arasındaki Hollanda nüfusunda gerçekleştirilen kesitsel bir çalışmadır. 1955, 1965 ve 1980 yıllarında yapılan önceki çalışmaların devamı niteliğindedir. Hollandalı erkek çocuklarının antropometrik ölçüleri kullanılarak büyüme eğrileri üzerine çalışmalar yer almaktadır (12-14). Türkiye’de ise farklı bölgelerde büyüme eğrileri üzerine çalışmalar yapılmış olup, en bilinen geniş kapsamlı olarak geliştirilen büyüme eğrileri ise 1978 yılında Neyzi ve ark. tarafından oluşturulmuştur. Yaşa göre boy uzunluğunun ve vücut ağırlığının sosyo-ekonomik düzeye göre değiştiği düşüncesiyle, toplumların gelişmesi ile birlikte ülke standartlarını oluşturacak büyüme eğrilerinin de yenilenmesi gerektiğini vurgulamışlardır. 2008 yılında İstanbul’da yaşayan çocukları kapsayan 1992-2006 yılları arasında izlenmiş 0-5 yaş grubunu oluşturan 2391 erkek ve 2102 kız çocuğunun büyüme eğrileri ile 1989-2002 yılları arasında izlenmiş 6-18 yaş grubunu oluşturan 1100 erkek ve 1020 kız çocuğunun büyüme eğrileri oluşturulmuştur (15-16). Zararsız ve arkadaşlarının 2017 yılında 6-17 yaş arası okul çağı çocuklarının boy uzunluğu ve vücut ağırlığı ölçülerine ilişkin gerçekleştirdiği referans çalışmasında, GAMLSS yöntemini karşılaştırarak cinsiyete göre persentil değerlerini sundukları kapsamlı çalışmaları bulunmaktadır (17). Günümüzde ise DSÖ (18) tarafından yayınlanan MGRS (Multicentre Growth Reference Study) - Çok Merkezli Büyüme Referans Çalışması ile dünya genelinde kullanılan standart büyüme eğrileri oluşturulmuştur. 6 2.2. LMS Yöntemi Cole, antropometrik ölçümlere ilişkin büyüme standartlarını etkili bir şekilde uydurmak (fit) için LMS (lambda, mu, sigma) yöntemini geliştirmiştir. Persentil eğrilerinin oluşturulmasında yöntemin adını aldığı üç eğri şu şekilde özetlenmektedir; L eğrisi (λ, Box-Cox kuvveti), M eğrisi (μ, medyan) ve S eğrisi (σ, değişim katsayısı). Bu yöntem, veride normal dağılım varsayımına uymasını gerektirirken aynı zamanda persentillerin ortalama ve standart sapmadan hesaplanmasına da izin verir. LMS yöntemi, her bir yaş grubundaki verilerin uygun bir kuvvet dönüşümü yardımıyla normal dağıtılabileceğini varsaymaktadır. Kuvvet değeri çarpıklığı kaldıracak şekilde seçilir, böylelikle dönüşüm sonrası veriler kabul edilebilir şekilde normal dağılıma yaklaşır. Kuvvet her bir yaş grubu için ayrı ayrı hesaplanmalıdır. Her bir yaş grubundaki kuvvet değerleri, yaşa karşı çizilen düzleştirilmiş eğri ile temsil edilir. Kuvvet, ortalama ve standart sapma yaşla birlikte düzleştirilmiş (smoothing) değişiyorsa persentiller de düzleştirilmiş değişmektedir. Eğer veriler gerçekten normal dağılıyorsa, kuvvet eğrisi çocukluk boyunca her yaşta düz ve 1’e yakın olmaktadır (14). LMS yöntemi yarı parametrik (semi-parametrik) bir yöntem olup Box-Cox kuvvet dönüşümü aracılığıyla veride düzleştirilmiş eğrilerin uydurulması sağlanır. Verinin çarpık olduğu durumda kuvvet dönüşümüyle, hem çarpıklığı en aza indirerek hem de normalliğe uyumu en iyi hale getirerek çarpık veri sorununa çözüm getirilir. LMS yönteminde standart sapma yaşla birlikte artma eğilimindedir. Değişim katsayısı daha iyi bir değişkenlik ölçüsü olup ortalamadan bağımsızdır. Ayrıca değişim katsayısı, çocukluk dönemindeki standart sapma değerine göre daha az değişir. Bu nedenle, değişkenliği ölçmek için her yaşta standart sapma yerine değişim katsayısı kullanılır (7). Her bir yaş grubu için L, M, S değerlerinin hesaplanması aşağıdaki adımlar takip edilerek yapılmaktadır (7-8). 1- Hesaplanacak antropometrik ölçüm için her bir yaş grubundaki ham verinin ayrı ayrı; orijinal ölçüm değerinin, logaritması alınan ölçüm değerinin ve tersi alınan ölçüm değerinin aritmetik ortalaması ve standart sapması hesaplanır. 7 2- Orijinal ölçüm değerinin aritmetik ortalama (𝑀𝑎) değeri, orijinal ölçüm değerinin geometrik ortalama (𝑀𝑔) değeri ve orijinal ölçüm değerinin harmonik ortalama (𝑀ℎ) değeri hesaplanır. 3- Üst adımlarda hesaplanan değerler ile değişim katsayıları aşağıda belirtildiği gibi hesaplanır. 𝑆𝑎 = Orijinal ölçüm değerinin standart sapması orijinal ölçüm değerinin geometrik ortalaması 𝑆𝑔 = logaritması alınan ölçüm değerinin standart sapması 𝑆ℎ = (tersi alınan ölçüm değerinin standart sapması) * (orijinal ölçüm değerinin geometrik ortalaması) 4- Bu değerlerin elde edilmesi ile aşağıda verilen eşitlik 2.1. ve eşitlik 2.2. hesaplanır. 𝐴 = 𝑙𝑜𝑔(𝑆𝑎 /𝑆ℎ) (2.1.) 𝐵 = 𝑙𝑜𝑔(𝑆𝑎𝑆ℎ/𝑆𝑔 2) (2.2.) Bu adımların sonunda her bir yaş grubu için ayrı ayrı L, M ve S değerleri eşitlik 2.3., eşitlik 2.4. ve eşitlik 2.5.’te verildiği gibi hesaplanır. 𝐿 = −𝐴 2𝐵 = 𝑙𝑜𝑔 ( 𝑆𝑎 𝑆ℎ ) 2𝑙𝑜𝑔 ( 𝑆𝑎𝑆ℎ 𝑆𝑔2 ) (2.3.) 𝑀 = 𝑀𝑔 + (𝑀𝑎 −𝑀ℎ)𝐿/2 + (𝑀𝑎 − 2𝑀𝑔 +𝑀ℎ)𝐿 2/2 (2.4.) 𝑆 = 𝑆𝑔𝑒𝑥𝑝 ( 𝐴𝐿 4 ) (2.5.) 8 Box-Cox tarafından önerilen ve yöntemin adını alan Box-Cox dönüşümü, bağımlı değişken üzerinde dönüşüm yapma tekniğidir (19-20). Bu yöntemin genel amacı normal dağılım göstermeyen veri seti üzerinde 𝑦𝜆 dönüşümünü gerçekleştirmektir. 𝑦’den 𝑦𝜆’ya parametrik dönüşümü iki alternatif ile eşitlik 2.6. ve eşitlik 2.7.’de tanımlanmaktadır. 𝑦 değeri antropometrik ölçüm değişkeni olarak tanımlanmakta olup ortalama μ’ye sahip olduğu ve 𝑦𝜆’nın normal dağıldığı varsayılmaktadır (log(𝑦) , 𝜆 = 0). 𝑦𝜆 = { 𝑦𝜆 − 1 𝜆 (𝜆 ≠ 0) log 𝑦 (𝜆 = 0) (2.6.) 𝑦𝜆 = { (𝑦 + 𝜆2) 𝜆1 − 1 𝜆1 (𝜆1 ≠ 0) log (𝑦 + 𝜆2) (𝜆1 = 0) (2.7.) Burada λ dönüşüm parametresidir ve bu dönüşümler 𝑦 > 0 ve 𝑦 > −𝜆2 olmasını gerektirir. Parametreler, normal dağılım varsayımında, gözlemlenen örneklemin 𝑦 = {𝑦1, … , 𝑦𝑛} olasılığını maksimize edecek şekilde seçilir. Aynı zamanda Box-Cox dönüşümünde λ parametresinin en çok olabilirlik tahmin edicisinin ölçülen değişkenin varyansını en aza indirgediği de gösterilmiş olup eşitlik 2.8. ya da eşitlik 2.9.’da verilmiştir. 𝑓(𝜆) = 𝑦(𝜆) �̇�𝜆−1 (2.8.) 𝑓(𝜆) = 𝑦(𝜆) 𝑔𝑚(𝑦 + 𝜆2)𝜆−1 (2.9.) Burada �̇� ve gm(.) geometrik ortalamayı göstermektedir. Bu denklemde belirtilmek istenen λ değeri ne olursa olsun 𝑓(𝜆)’nın 𝑦 ile aynı boyutta olduğu ve dolayısıyla λ 9 değiştikçe 𝑣𝑎𝑟(𝑓(𝜆)), 𝑣𝑎𝑟(𝑦) ile aynı birimde kalmasıdır. Ayrıca 𝑣𝑎𝑟(𝑓(𝜆)) minimize edildiğinden, λ parametresindeki küçük farkların varyans üzerinde etkisi çok az olur (19-20). Ölçüm değişkeninde normalliği sağlamak için eşitlik 2.10.’da gösterildiği gibi Box-Cox kuvvet dönüşümü uygulanarak yeni bir 𝑥 değişkenine dönüştürülür. 𝑥 = ( 𝑦 𝜇) 𝜆 − 1 𝜆 , 𝜆 ≠ 0 𝑥 = 𝑙𝑜𝑔( 𝑦 𝜇⁄ ), 𝜆 = 0 (2.10.) Burada, λ parametresinin en uygun değeri için 𝑥’in standart sapması minimize edilir. (𝜆 = 1 ) için 𝑥’in standart sapması ve 𝑦’nin değişim katsayısı aynı olup eşitlik 2.11.’de gösterildiği gibi 𝑦 için 𝑧-skoru elde edilir. 𝑧 = 𝑥 𝜎 𝑧 = (𝑦/𝜇)𝜆 − 1 𝜆𝜎 , 𝜆 ≠ 0 𝑧 = 𝑙𝑜𝑔 ( 𝑦 𝜇) 𝜎 , 𝜆 = 0 (2.11.) Eşitlik 2.11.’de elde edilen denklemde λ yerine 𝐿(𝑡), μ yerine 𝑀(𝑡) ve σ yerine 𝑆(𝑡) yazıldığında eşitlik 2.12. elde edilir. Bu denklem aracılığıyla bireysel olarak herhangi bir antropometrik ölçümü bilinen bir çocuğun kendi yaşıtlarındaki referans popülasyondan hesaplanan L, M ve S değerleri kullanılarak Z-skoru hesaplanmaktadır. Burada, 𝑡 değişkeni yaş değişkeni olup her bir 𝑡 zamanda 𝑦 antropometrik ölçümü için persentil değerlerinin hesaplanması eşitlik 2.13.’te gösterilmektedir. Denklemde verilen 𝑍𝛼, persentil değerine karşılık gelen Z-skorunu temsil etmektedir (8). 10 𝑍 = { [ 𝑦 𝑀(𝑡)⁄ ] 𝐿(𝑡) − 1 𝐿(𝑡)𝑆(𝑡) , 𝐿(𝑡) ≠ 0 𝑙𝑜𝑔 [ 𝑦 𝑀(𝑡)⁄ ] 𝑆(𝑡) , 𝐿(𝑡) = 0 } (2.12.) 𝐶100𝛼 = { 𝑀(𝑡)(1 + 𝐿(𝑡)𝑆(𝑡)𝑍𝛼) 1 𝐿(𝑡), 𝐿(𝑡) ≠ 0 𝑀(𝑡) exp[𝑆(𝑡)𝑍𝛼] , 𝐿(𝑡) = 0 } (2.13.) 𝐿(𝑡), 𝑀(𝑡) ve 𝑆(𝑡) eğrilerinin tahmininde eşitlik 2.12.’den türetilen ℓ log- olabilirlik fonksiyonu eşitlik 2.14.’te tanımlanmaktadır. Burada 𝑍𝑖 değerleri antropometrik ölçüme karşılık gelen standart sapma değerleridir. ℓ = ℓ(𝐿,𝑀, 𝑆) =∑(𝐿(𝑡𝑖)𝑙𝑜𝑔 𝑦𝑖 𝑀(𝑡𝑖) − 𝑙𝑜𝑔𝑆(𝑡𝑖) − 1 2 𝑍𝑖 2) 𝑛 𝑖=1 (2.14.) 𝐿(𝑡), 𝑀(𝑡) ve 𝑆(𝑡) eğrileri cezalandırılmış olabilirlik fonksiyonunun maksimum yapılmasıyla L, M ve S eğrilerinin düzgünlüğü arasında bir denge sağlanmaktadır ve eşitlik 2.15.’te verildiği gibi kestirilmektedir. ℓ − 1 2 𝛼λ∫{𝐿 ′′(𝑡)}2𝑑𝑡 − 1 2 𝛼μ∫{𝑀 ′′(𝑡)}2𝑑𝑡 − 1 2 𝛼σ∫{𝑆 ′′(𝑡)}2𝑑𝑡 (2.15.) Bu eşitlikte 𝛼λ, 𝛼μ ve 𝛼σ düzleştirme parametreleridir. Düzleştirme parametreleri etkili / eşdeğer serbestlik derecesi (e.s.d.) (effective / equivalent degrees of freedom – e.d.f.) olarak adlandırılmaktadır ve her bir uydurulan L, M ve S eğrilerinin karmaşıklığı e.s.d. aracılığıyla ölçülmektedir (8). Etkili serbestlik derecelerinin kullanımında örneğin verileri normal bir dağılımla sınırlanması istendiğinde 𝐿(𝑡) = 1 iken yaşa göre değişmeyen Box-Cox dönüşümü 𝐿(𝑡) = 𝜆 olmaktadır (21). 11 2.3. Düzleştirme (Smoothing) Persentil eğrilerini oluştururken; eğriler düzleştirilmiş olmalı, eğriler kesişmemeli ve normal dağılım göstermeyen her bir yaş grubu için çarpıklık ve basıklık hesaba katılarak eğrilerde esneklik sağlanmalıdır. Bu belirtilen adımların tamamı LMS yönteminde her bir yaş grubundaki ölçümün Box-Cox dönüşümü ve LMS yöntemindeki parametrelerin yardımıyla normal dağılıma yaklaştığı varsayımı ile gerçekleştirilir (22). Farklı yaş gruplarına göre örneklem değişkenliğinden, ölçüm değişkenliğinden ve aykırı gözlemlerin varlığından dolayı büyüme eğrilerini oluştururken veride düzleştirmeye ihtiyaç duyulmaktadır. Örneklem büyüklüğü yeterli olsa dahi veride düzleştirmenin yapılmaması düzensiz büyüme eğrilerinin oluşturulmasına yol açar. Özellikle büyüme hızının daha hızlı olduğu bebeklik ve ergenlik dönemlerinde yaş üzerinde esnek düzleştirmeye ihtiyaç duyulur. Yaşa bağlı olarak ölçümlerde iniş ve çıkışlar olabileceğinden düzleştirmeden önce yaş dönüşümünün kullanılması gerekir (23). Antropometrik ölçüm değerleri yaşa bağlı değişkenlik gösterdiğinden persentil eğrileri oluşturulurken referans aralıkları yaşla birlikte değişim göstermektedir. Persentil eğrilerinin düzleştirilmesinin temel mantığı, yaştaki küçük bir değişikliğin ölçümde sürekli bir değişkenliğe yol açmasıdır. Her bir yaş kategorisinde ölçüm değerinin az olması ve ergenlik / çocukluk dönemi gibi büyümenin hızlı olduğu dönemlerde yaşa bağlı olarak değişimin fazla olmasından dolayı eğride dalgalanmalar olmaktadır. Bu nedenle eğrilerde düzleştirmeye ihtiyaç duyulmaktadır (14). Büyüme eğrilerinin oluşturulmasında düzleştirilmemiş boy uzunluğu persentilleri yaşla birlikte monoton olarak artış göstermekle birlikte nispeten daha az değişkenlik göstermektedir. Vücut ağırlığı persentilleri ise yaşla birlikte monoton olarak artma eğiliminde, fakat yaşa bağlı değişkenlik de fazla olduğundan daha çarpık bir dağılım elde edilmektedir. Bu tez kapsamında kullanılan veri setinde erkek çocuklarının boy uzunluğu ve vücut ağırlığı persentillerinin düzleştirilmemiş eğrilerden elde edilen grafikler Şekil 2.1’de gösterilmektedir. 12 Şekil 2.1. Düzleştirilmemiş boy uzunluğu ve vücut ağırlığı büyüme eğrileri 2.3.1. Spline Spline fonksiyonları eğri uydurmada kullanılan parçalı polinomlardır. Bu durumda “x” bağımsız değişkeninin farklı aralıklarında bağlanan polinomlardan oluşmaktadır. Doğrusal yani I. dereceden spline fonksiyonu en basit spline fonksiyonudur. x ekseninin düğüm adı verilen a, b, c noktalarında aralıklara bölündüğü varsayımında, doğrusal spline fonksiyonu eşitlik 2.16. ve eşitlik 2.17.’de tanımlanmakta olup Şekil 2.2’de gösterilmiştir (24). 𝑓(𝑥) = 𝛽0 + 𝛽1𝑥 + 𝛽2(𝑥 − 𝑎)+ + 𝛽3(𝑥 − 𝑏)+ + 𝛽4(𝑥 − 𝑐)+ (𝑢)+ = 𝑢, 𝑢 > 0, 0, 𝑢 ≤ 0 (2.16.) 𝑓(𝑥) = { 𝛽0 + 𝛽1𝑥 𝑥 ≤ 𝑎 𝛽0 + 𝛽1𝑥 + 𝛽2(𝑥 − 𝑎) 𝑎 < 𝑥 ≤ 𝑏 𝛽0 + 𝛽1𝑥 + 𝛽2(𝑥 − 𝑎) + 𝛽3(𝑥 − 𝑏) 𝑏 < 𝑥 ≤ 𝑐 𝛽0 + 𝛽1𝑥 + 𝛽2(𝑥 − 𝑎) + 𝛽3(𝑥 − 𝑏) + 𝛽4(𝑥 − 𝑐) 𝑐 < 𝑥} (2.17.) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 5 0 6 0 7 0 8 0 9 0 1 0 0 Yaş (yıl) B o y u z u n lu ğ u ( c m ) 0.030.05 0.10 0.25 0.50 0.75 0.90 0.95 0.97 0.030.05 0.10 0.25 0.50 0.75 0.90 0.95 0.97 0.0 0.5 1.0 1.5 2.0 2.5 3.0 4 6 8 1 0 1 2 1 4 1 6 Yaş (yıl) V ü c u t a ğ ır lı ğ ı (k g ) 0.03 0.050.10 0.25 0.50 0.75 0.90 0.950.97 0.03 0.050.10 0.25 0.50 0.75 0.90 0.950.97 13 Şekil 2.2. a=1, b=3, c=5 düğümleri ile doğrusal spline fonksiyonu Kübik Spline Doğrusal spline fonksiyonları eğri uydurmada esnek ve düzgün sonuçlar vermediğinden daha yüksek dereceden parçalı polinomların birleştirilmesi ile kübik spline fonksiyonları geliştirilmiştir. Fonksiyonun birinci ve ikinci türevlerinde düğümde birleşme sağlayarak düzgün eğrilerin oluşmasına olanak sağlamaktadır (24). 𝑎, 𝑏, 𝑐 düğümlerinde düzgün kübik spline fonksiyonu eşitlik 2.18.’de verilmektedir. 𝑓(𝑥) = 𝛽0 + 𝛽1𝑥 + 𝛽2𝑥 2 + 𝛽3𝑥 3 + 𝛽4(𝑥 − 𝑎)+ 3 + 𝛽5(𝑥 − 𝑏)+ 3𝛽6(𝑥 − 𝑐)+ 3 = 𝑥𝛽 𝑥1 = 𝑥, 𝑥2 = 𝑥2, 𝑥3 = 𝑥3, 𝑥4 = (𝑥 − 𝑎)+ 3 𝑥5 = (𝑥 − 𝑏)+ 3 𝑥6 = (𝑥 − 𝑐)+ 3 (2.18.) B-spline B-splinelar düğümler ile belirli x değerlerinde polinom parçalarının birleştirilmesiyle oluşturulur. Düğüm seçimi oldukça önemli olup çok fazla düğüm kullanılması verinin aşırı uyum (overfitting) sorununa neden olurken, çok az sayıda düğüm seçilmesi ise veride yetersiz uyuma neden olmaktadır (25). 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 f( x ) x 14 Tek değişkenli B-splinelar parçalı polinom fonksiyonlarıdır. Bu da şu şekilde açıklanabilir; 𝑞 dereceli bir B-spline 𝑡𝑚𝑖𝑛 ve 𝑡𝑚𝑎𝑥 dış düğüm sınırları arasında 𝑞 noktalarında 𝑡𝑖 iç düğümlerinde düzgün bir şekilde birleştirilen (yani 𝑞 − 1 düzeyinde türevlenebilen) 𝑞 + 1 polinom parçalarından oluşur. X’in bağımsız değişken olduğu parametrik olmayan regresyon için B- splineların kullanımı eşitlik 2.19.’da gösterilmektedir. ∀𝑥: ∑𝐵𝑗(𝑥, 𝑞) = 1 𝑟 𝑗=1 (2.19.) Burada, 𝑟 çakışan B-splineların bir temelini oluştur. 𝐵𝑗(𝑥, 𝑞) ile gösterilen en soldaki 𝑗 düğümü ile 𝑞 dereceli B-spline ifade edilmektedir. 𝑚 gözlem için (𝑥𝑖, 𝑦𝑖) ve ∝𝑗 B- spline’ın katsayısıdır ve eşitlik 2.20.’de tanımlanmıştır (26). �̂�(∝)𝑖 =∑ ∝𝑗 𝐵𝑗(𝑥𝑖, 𝑞), 𝑖 = 1,… ,𝑚 𝑟 𝑗=1 (2.20.) Şekil 2.3. B-spline grafikleri Şekil 2.3’te verilen soldaki grafik birinci dereceden B-spline örneğidir. Grafiğin içindeki sadece kırmızı kesikli çizgiden oluşan eğriye bakıldığında, iç düğüm ile birleştirilen iki doğrusal parçadan oluşmaktadır ve grafiğin tamamı ise üç düğüm ile gösterilmiştir. Sağdaki grafik ise üçüncü dereceden yani kübik B-spline örneğidir. 15 P-spline Eilers ve Marx (27) tarafından en küçük kareler regresyonunda aşırı uyumu düzeltmek için ek bir ceza ile P-spline regresyonunu geliştirmişlerdir. P-spline eğrileri, her biri x ekseninin küçük bir bölümünü kapsayan B-spline temel fonksiyonlarının toplamıdır. Aslında P-spline eğrileri parametrik modellere dayanmaktadır, fakat ceza katsayısı ile yarı parametrik ve parametrik modeller arasında bağlantı kuran polinom eğrisi uyumu elde edilir. P-splinelar, cezalandırılmış B-splinelardır (28). B-spline regresyonundaki en önemli problem, en uygun B-spline sayısının seçimidir. Yetersiz sayıda B-spline seçimi eksik uyuma neden olurken, çok fazla sayıda B-spline seçimi aşırı uyuma neden olur. Bu nedenle, düzgünlüğü düzenlemek ve fazla uyumu düzeltmek için bir ceza ile birlikte fazla sayıda eşit aralıklı B-spline kullanılması önerilmekte olup, bu yaklaşıma P-spline regresyonu adı verilmektedir (26). 2.4. Z-skoru ve Persentil Pediatrik büyüme eğrilerinin değerlendirilmesi ve yorumlanmasında Z-skoru ve persentil değerleri kullanılmaktadır. Klinik olarak çocukların büyüme, gelişim ve beslenme durumlarının değerlendirilmesinde persentil değerlerinin kullanımı yaygın olmakla birlikte bazı antropometrik ölçümlere ilişkin değerlendirmelerde de Z-skoru kullanılmaktadır. Z-skoru, antropometrik ölçüm değerinin ortalaması 0, standart sapması 1 olan yeni bir değere dönüştürülmesidir. Z-skorlarına standart sapma skorları da denilmektedir. Z-skorları yardımıyla ölçülen bir değerin genel popülasyon ortalamasından ne kadar uzakta olduğu incelenir. Z-skorları referans popülasyonun ortalama ve standart sapma bilgilerini kullanarak yaşa, cinsiyete özgü hesaplanmaktadır. Bireysel bir antropometrik ölçüm (x) ve genel popülasyonun antropometrik ölçüm ortalaması (μ) olarak tanımlandığında, bu iki ölçüm arasındaki fark genel popülasyonun standart sapmasına (σ) bölünmesiyle eşitlik 2.21.’de gösterildiği gibi bireysel z-skoru elde edilecektir. 𝑍𝑖 = 𝑥𝑖 − 𝜇 𝜎 (2.21.) 16 Persentil (percentile / centile) yüzdelik olarak da ifade edilen değer, bir çocuğun antropometrik ölçümünün belirli referans dağılımındaki konumunu ifade eder. Yaşa ve cinsiyete özgü bilinen bir ölçüm değerinin referans popülasyonda kaçıncı yüzdelik dilime geldiği hesaplanır ve bu değerin genel popülasyondaki yeri karşılaştırılır (29). Persentil grafikleri, bağımsız değişken olarak yaşa (zamana) karşı ölçüm değerleri sonucu oluşturulan bir dizi düzleştirilmiş yüzdelik eğrilerdir. Genelde Persentiller 3., 5., 10., 25., 50., 75., 90., 95., ve 97. persentillerden oluşmaktadır. Yaygın kullanılan bu persentil değerlerine karşılık gelen Z-skorları da Tablo 2.1.’de gösterilmiştir (7). Tablo 2.1. Sık kullanılan persentillere karşılık gelen Z-skorları Persentil 1 2,5 3 5 10 25 50 Z-skoru -2,326 -1,960 -1,881 -1,645 -1,282 -0,674 0 Persentil 99 97,5 97 95 90 75 50 Z-skoru 2,326 1,960 1,881 1,645 1,282 0,674 0 DSÖ, çocukların büyüme ve beslenme durumunun takibinde Z-skorlarına dayalı büyüme referanslarının kullanılmasını önermiştir. Fakat özellikle 2 yaşın üzerindeki çocukların aşırı kilo, obezite takibinin yanı sıra zayıflığını da değerlendirebilmek için boy uzunluğuna göre vücut ağırlığı Z-skorları yerine cinsiyete ve yaşa özgü BKİ persentillerinin kullanılması konusunda artan görüş olduğunu vurgulamışlardır (29). Büyüme grafiklerinde Z-skorlarının avantajı, persentil aralıklarının dışındaki değerler de yorumlanmaktadır. Z-skorlarının kullanımındaki sınırlılık ise klinik ortamlarda sınırlı kullanışı ve değerlerin açıklanmasının persentil kadar kolay olmayışıdır. Persentillerin klinik kullanım ve değerlerin yorumlanma kolaylığı açısından daha sık tercih edilmektedir (29). LMS yöntemine göre cinsiyete ve yaşa özgü tüm popülasyonu temsil eden Z- skorunun hesaplanması Eşitlik 2.22’de verilmiştir. Bu denklemde, t zamanda yani belirli bir yaş grubu için hesaplanan L, M, S değerleri ile -3 < Z-skoru < +3 aralığı için Z-skoru hesaplanmaktadır. DSÖ çalışmalarında olduğu gibi Z-skoru tabloları [- 17 3, +3] standart sapma olarak ifade edildiğinden eşitlik 2.22.’de verilen denklem -3SS (-3 standart sapma) ve +3SS (+3 standart sapma) için hesaplanış örneğini göstermektedir (18). +3𝑆𝑆 = 𝑀(𝑡)[1 + 𝐿(𝑡)𝑆(𝑡)(3)]1/𝐿(𝑡) −3𝑆𝑆 = 𝑀(𝑡)[1 + 𝐿(𝑡)𝑆(𝑡)(−3)]1/𝐿(𝑡) (2.22.) 2.5. GAMLSS Modelinin Geliştirilmesi GAMLSS (Generalized additive model for location, scale and shape) modelinin oluşturulması; doğrusal model (linear model – LM), genelleştirilmiş doğrusal model (generalized linear model – GLM) ve genelleştirilmiş toplamsal model (generalized additive model – GAM) yöntemlerine dayanmaktadır (30). 2.5.1. Doğrusal Model (Linear Model) Doğrusal model, klasik doğrusal regresyon modeli olup eşitlik 2.23.’te tanımlanmaktadır. 𝑌𝑖 = 𝛽0 + 𝛽1𝑥1𝑖 +⋯+ 𝛽𝑝𝑥𝑝𝑖 + 𝜖𝑖 (2.23.) i=1,…,n için Y bağımlı değişken olup i=1,…,n için 𝑥1𝑖, … , 𝑥𝑝𝑖 bağımsız değişkendir. Her bir x değerine karşılık gelen y değeri eşit varyans ve normal dağılım gösterir (𝑌 = X𝛽 + 𝜖, 𝜖~𝑁(0, 𝜎2)). Modelin olabilirlik ve log-olabilirlik fonksiyonları sırasıyla eşitlik 2.24. ve eşitlik 2.25’te tanımlanmıştır. 𝐿(𝛽, 𝜎2) = (2𝜋𝜎2)−𝑛/2𝑒𝑥𝑝 { −1 2𝜎2 (Y − X𝛽)⊤(Y − X𝛽)} (2.24.) ℓ(𝛽, 𝜎2) = 𝑛 2 log(2𝜋𝜎2) − 1 2𝜎2 (Y − X𝛽)⊤(Y − X𝛽) (2.25.) 18 Doğrusal regresyon modelinin belirtilmesinde; bağımlı değişken ile bağımsız değişken arasındaki ilişkinin doğrusal olmaması, hata terimleri ve nihayetinde bağımlı değişkenin normal dağılım göstermemesi, hataların birbirinden bağımsız olmaması, hatanın varyansının sabit olmaması gibi sorunlar ile karşılaşılabilir. Bu belirtilen problemler için özellikle değişkenler arasında doğrusallığın sağlanmaması ve değişkenlerin normal dağılım göstermemesi durumunda genelleştirilmiş doğrusal modeller çözüm bulmaktadır (30). 2.5.2. Genelleştirilmiş Doğrusal Model (Generalized Linear Model) Genelleştirilmiş doğrusal modeller, Nelder ve Wedderburn (31) tarafından bağımlı değişkenin normal dağılım varsayımını sağlamadığı durum için geliştirilmiş olup genelleştirilmiş doğrusal modelleri; normal, binom, Poisson ve gamma dağılımları için örnekler ile özetlemiştir. Genelleştirilmiş doğrusal model, bağımlı değişken ile bağımsız değişkenler arasındaki ilişkiyi incelemek için kullanılır. Bu modelin doğrusal regresyon modelinden farkı, bağımlı değişkenin üstel dağılım ailesinden seçilmesi ve bu nedenle dağılımın normal veya normale yakın olması varsayımını aramamasıdır. Bağımlı değişkenin ortalamasının dönüşümü bağımsız değişkenler ile doğrusal olarak ilişkilidir. Burada, Y bağımlı değişkeni için genelleştirilmiş doğrusal model eşitlik 2.26.’da tanımlanmaktadır. 𝑓(𝑌) = 𝑐(𝑦, 𝜙) exp { 𝑦(𝜃) − 𝑎(𝜃) 𝜙 } 𝑔(𝜇) = 𝑥′𝛽 (2.26.) 𝑓(𝑌) denklemi, bağımlı değişkenin üstel dağılım ailesinden olduğunu gösterir ve bu form normal, Poisson, gamma vb. gibi önemli dağılımları içerir. Ortalamanın bir dönüşümü olan 𝑔(𝜇) denklemi ise x’in içerdiği bağımsız değişkenler ile doğrusal ilişkilidir ve monoton bağlantı fonksiyonu olarak tanımlanmaktadır. 𝑎(𝜃)’nın seçimi bağımlı değişkenin dağılımını belirtir. Burada, 𝑔(𝜇) bağlantı fonksiyonunun seçimi 19 ortalamanın x bağımsız değişkenler ile nasıl ilişkili olduğunu belirtir. Doğrusal regresyon modelinde y’nin ortalaması ile bağımsız değişkenler arasında 𝜇 = 𝑥′𝛽 formunda ilişki varken, genelleştirilmiş doğrusal modelde 𝑔(𝜇) = 𝑥′𝛽 formunda ilişki vardır ve 𝑔 monoton türevlenebilir fonksiyondur (30). Burada, 𝛽 ve 𝜙 parametrelerinin en çok olabilirlik tahmini log-olabilirliğin maksimize edilmesiyle eşitlik 2.27.’de elde edilmektedir. ℓ(𝛽, 𝜙) =∑ln 𝑓(𝑦𝑖; 𝛽, 𝜙) =∑{ln 𝑐(𝑦𝑖 , 𝜙) + 𝑦𝑖𝜃𝑖 − 𝑎(𝜃𝑖) 𝜙 } 𝑛 𝑖=1 𝑛 𝑖=1 (2.27.) Newton-Raphson Yöntemi (Newton-Raphson Iteration) ∑ 𝜕𝜃𝑖 𝜕𝜂𝑖 𝑥𝑖𝑗(𝑦𝑖 − 𝜇𝑖) = 0, 𝜂𝑖 = 𝑥′𝑖𝛽 𝑛 𝑖=1 tanımlanan denklemde, olabilirlik maksimizasyonu için birinci dereceden koşulların doğrudan çözülmesi genellikle zor olduğundan, Newton-Raphson iterasyonu (yinelemesi) ile maksimize edilecek fonksiyonun birinci ve ikinci türevlerinin her noktada kolaylıkla değerlendirilebileceği varsayılmıştır. Bilinmeyen parametre vektörü 𝛽’nın bir fonksiyonu olarak log-olabilirlik ℓ(𝛽) ile gösterilmiş olup, her bir 𝛽 noktasında Taylor serisi yaklaşımı eşitlik 2.28.’de tanımlanmıştır. ℓ(𝛽 + 𝛿) ≈ ℓ(𝛽) + ℓ̇(𝛽)𝛿 + 𝛿2 2 ℓ(̈𝛽) (2.28.) Eşitlik 2.29.’da verilen denklem 𝛿 parametresinin bir fonksiyonu olarak farklılaştırılır ve 0’a eşitlenir. ℓ̇(𝛽) + 𝛿ℓ(̈𝛽) = 0, 𝛿 = −{ℓ(̈𝛽)} −1 ℓ̇(𝛽) (2.29.) 𝑚 iterasyonunda 𝛽’nın değeri 𝛽(𝑚) ile belirtildiğinde eşitlik 2.30. elde edilir. 𝛽(𝑚+1) = 𝛽(𝑚) − {ℓ(̈𝛽𝑚)} −1 ℓ̇(𝛽𝑚) (2.30.) 20 Fisher Skorlaması (Fisher Scoring) Fisher, eşitlik 2.30.’da verilen denklemde yer alan ℓ(̈𝛽)’nin E{ℓ(̈𝛽)} olarak değiştirilmesini önererek E{ℓ(̈𝛽)} = −E{ℓ̇(𝛽)ℓ̇′(𝛽)} denklemini göstermiştir ve bu sonuçların sadece üstel dağılım ailesi için değil tüm log-olabilirlik fonksiyonları için geçerli olduğunu belirtmiştir. Burada, −E{ℓ(̈𝛽)} matrisi bilgi matrisi olarak adlandırılmış olup genelleştirilmiş doğrusal modeller için eşitlik 2.31.’deki gibi tanımlanmaktadır (30). E{ℓ̇(𝛽)ℓ̇′(𝛽)} = 𝜙−2𝑋′𝐷𝐸{(𝑦 − 𝜇)(𝑦 − 𝜇)′}𝐷𝑋 = 𝜙−1𝑋′𝑊𝑋 (2.31.) 2.5.3. Genelleştirilmiş Toplamsal Model (Generalized Additive Model) Genelleştirilmiş toplamsal modeller, bağımlı değişkenin etkisini parametrik olmayan fonksiyonel formlar açısından modellemektedir. Genelleştirilmiş doğrusal modelde olduğu gibi bağımlı değişken üstel dağılım ailesinden gelmektedir. Bağımsız değişkenler eşitlik 2.32.’de verildiği gibi tanımlanır ve burada 𝑠𝑗’ler 𝑥𝑗 bağımsız değişkenlerin düzleştirilmiş fonksiyonudur (32). 𝑔𝜇 = 𝛽0 + 𝑠1(𝑥1) + ⋯+ 𝑠𝑝(𝑥𝑝) (2.32.) 2.5.4. GAMLSS Modeli (Generalized Additive Models for Location, Scale and Shape) Konum (location), ölçek (scale) ve şekil (shape) için genelleştirilmiş toplamsal modeller yarı parametrik regresyon modelleridir. Bu model, bağımlı değişkenin parametrik dağılım varsayımı gerektirmesi bakımından parametrik olmaktadır. Parametrik olmayan düzleştirme fonksiyonlarının kullanımıyla da bağımsız değişkenlerin fonksiyonları olarak dağılım parametrelerinin modellenmesi açısından ise yarı parametrik yöntemdir. GAMLSS modelinde, bağımlı değişken (Y) için üstel dağılım ailesi varsayımı hafifletilerek, yerine büyük ölçüde çarpık ve basık dağılımları içeren genel bir dağılım ailesi gelmektedir (30). 21 Genelleştirilmiş toplamsal modeller aracılığıyla bağımsız değişkenlerin düzgün fonksiyonlarını dahil ederek yeni model oluşturulmaktadır. Bunun üzerine Rigby ve Stasinopoulos tarafından genelleştirilmiş toplamsal modellere konum, yaygınlık, çarpıklık ve basıklığı da modelleyebilen dört dağılım parametresi eklenerek GAMLSS modeli geliştirilmiştir. Aynı zamanda GAMLSS modeli, bağımsız değişkenlerin bir fonksiyonu olarak bağımlı değişkeni esnek bir şekilde modellemeyi sağlamaktadır (33). GAMLSS modeli i=1,2,…,n için 𝑌𝑖 her biri bağımsız değişkenin fonksiyonu olabilen dört dağılım parametresinin bir vektörü olan 𝜃𝑖 = (𝜃1𝑖 , 𝜃2𝑖 , 𝜃3𝑖,𝜃4𝑖) = (𝜇𝑖, 𝜎𝑖, 𝜈𝑖, 𝜏𝑖) koşuluna bağlı 𝑓𝑌(𝑦𝑖 ∣ 𝜃 𝑖) olasılık yoğunluk fonksiyonuna sahip olduğunu varsayar. (𝜇𝑖, 𝜎𝑖, 𝜈𝑖, 𝜏𝑖) dağılım parametreleridir. İlk iki parametre 𝜇𝑖 konum ve 𝜎𝑖 ölçek parametreleri olarak, son iki parametre ise 𝜈𝑖 ve 𝜏𝑖 şekil parametreleri olup sırasıyla çarpıklık ve basıklık parametreleri olarak adlandırılmaktadır. k = 1, 2, 3, 4 için 𝑔𝑘(. ) dağılım parametrelerinin monoton bağlantı fonksiyonu olarak tanımlandığında, GAMLSS modeli formülü eşitlik 2.33.’te tanımlanmaktadır. Denklemde (μ, σ, ν, τ) olan yerler 𝜃𝑘 ve 𝜂𝑘, k = 1, 2, 3, 4 için n boyutunda vektörlerdir. 𝛽𝑘 ⊤ = (𝛽1𝑘, 𝛽2𝑘,…,𝛽𝐽′𝑘𝑘) parametre vektörüdür. Bu model ile her bir dağılım parametresinin bağımsız değişkenlerin birer doğrusal fonksiyonu olarak modellenmesi sağlanır. 𝑔𝑘(𝜃𝑘) = 𝜂𝑘 = X𝑘𝛽𝑘 +∑𝑍𝑗𝑘𝛾𝑗𝑘 𝐽𝑘 𝑗=1 , 𝑔1(𝜇) = 𝜂1 = X1𝛽1 +∑𝑍𝑗1𝛾𝑗1 𝐽1 𝑗=1 𝑔2(𝜎) = 𝜂2 = X2𝛽2 +∑𝑍𝑗2𝛾𝑗2 𝐽2 𝑗=1 𝑔3(𝜈) = 𝜂3 = X3𝛽3 +∑𝑍𝑗3𝛾𝑗3 𝐽3 𝑗=1 𝑔4(𝜏) = 𝜂4 = X4𝛽4 +∑𝑍𝑗4𝛾𝑗4 𝐽4 𝑗=1 (2.33.) 22 GAMLSS modelinin birkaç önemli alt modelinin formülleri aşağıda tanımlanan eşitliklerde yer verilmiş olup BCCG (Box-Cox Cole Green) ve BCT (Box-Cox t) dağılımlarını içeren modeller bu denklemler ile ifade edilmiştir. GAMLSS modelinin yarı-parametrik toplamsal model formülü eşitlik 2.34.’te yer almaktadır. Bu denklemde eşitlik 2.30.’da yer alan 𝑍𝑗𝑘=I𝑛 olup I𝑛, 𝑛 x 𝑛 birim matristir. 𝛾𝑗𝑘 ise 𝑗 ve 𝑘’nın tüm kombinasyonları için 𝛾𝑗𝑘 = ℎ𝑗𝑘 = ℎ𝑗𝑘(𝑥𝑗𝑘) olarak ifade edilmektedir. 𝜃𝑘 parametresi k = 1, 2, 3, 4 için μ, σ, ν, τ dağılım parametrelerini temsil etmektedir. Dağılım parametrelerinin herhangi birinde toplamsal terim olmadığında eşitlik 2.35.’te verilen parametrik doğrusal GAMLSS modeli elde edilir. 𝑔𝑘(𝜃𝑘) = 𝜂𝑘 = X𝑘𝛽𝑘 +∑ℎ𝑗𝑘(x𝑗𝑘) 𝐽𝑘 𝑗=1 (2.34.) 𝑔1(𝜃𝑘) = 𝜂𝑘 = X𝑘𝛽𝑘 (2.35.) Eşitlik 2.34.’te verilen denklemde μ, σ, ν, τ için modele doğrusal olmayan parametrik terimlerin eklenmesiyle eşitlik 2.36. elde edilir ve bu model doğrusal olmayan yarı-parametrik toplamsal GAMLSS modeli olarak adlandırılmaktadır. k= 1, 2, 3, 4 için ℎ𝑘 doğrusal olmayan fonksiyonlardır. Tüm dağılım parametreleri için toplamsal terimler olmadığında (𝐽𝑘= 0), eşitlik 2.36. doğrusal olmayan parametrik GAMLSS modeline indirgenir ve eşitlik 2.37.’de gösterilmektedir. 𝑔𝑘(𝜃𝑘) = 𝜂𝑘 = ℎ𝑘(X𝑘𝛽𝑘) +∑ℎ𝑗𝑘(x𝑗𝑘) 𝐽𝑘 𝑗=1 (2.36.) 𝑔𝑘(𝜃𝑘) = 𝜂𝑘 = ℎ𝑘(X𝑘𝛽𝑘) (2.37.) GAMLSS modeli, doğrusal ve doğrusal olmayan parametrik terimlerin bir kombinasyonudur. Eşitlik 2.35. ve/veya eşitlik 2.37. modellerinin herhangi bir kombinasyonu parametrik GAMLSS modeli olarak adlandırılmaktadır. 23 GAMLSS modeli çerçevesinde 𝛽𝑘 ve 𝛾𝑗𝑘 parametreleri, cezalandırılmış olabilirlik fonksiyonunun maksimize edilmesiyle tahmin edilir ve ℓ𝑝(𝛽, 𝛾) denklemi eşitlik 2.38.’de verilmektedir (30). ℓ𝑝(𝛽, 𝛾) = ℓ(𝛽, 𝛾) − 1 2 ∑∑𝜆𝑗𝑘𝛾𝑗𝑘 ⊤G𝑗𝑘𝛾𝑗𝑘 𝐽𝑘 𝑗=1 𝑝 𝑘=1 (2.38.) Burada, ℓ(𝛽, 𝛾) = ∑ 𝑙𝑜𝑔𝑓𝑌( 𝑦𝑖 ∣∣ 𝜃 𝑖 ) = ∑ 𝑙𝑜𝑔𝑓𝑌( 𝑦𝑖 ∣∣ 𝜇𝑖, 𝜎𝑖 , 𝜈𝑖, 𝜏𝑖 ) 𝑛 𝑖=1 𝑛 𝑖=1 fonksiyonu dağılım parametrelerinin log-olabilirlik fonksiyonudur. 2.6. LMSP ve LMST Yöntemleri LMSP ve LMST yöntemleri, Rigby ve Stasinopoulos tarafından geliştirilmiş olup büyüme eğrilerinin oluşturulmasında kullanılmaktadır. Geliştirdikleri yönteme GAMLSS modeli adını vererek antropometrik ölçüm değişkenlerinin modellenmesinde kullanılmaktadır. Açıklayıcı değişkeninin parametrik varsayımı gerektirmesi bakımından parametrik olmayan düzleştirme fonksiyonları kullanılarak dağılım parametreleri tahmin edilir. Böylelikle GAMLSS modeli yarı parametrik regresyon modelidir. GAMLSS modelinde dağılımın özelliğine göre LMS, LMSP ve LMST yöntemleri ile büyüme eğrileri oluşturulmaktadır ve LMS yöntemi BCCG (Box-Cox Cole Green) dağılımı, LMSP yöntemi BCPE (Box-Cox power exponential) dağılımı ve LMST yöntemi BCT (Box-Cox t) dağılımı olarak adlandırılmaktadır (9-10). 2.6.1. BCPE ve BCT Dağılımları Box-Cox kuvveti üstel dağılımı, antropometrik ölçümün hem çarpıklığını hem de basıklığını modelleyen dört parametreli dağılıma sahip olup BCPE dağılımı olarak adlandırılmaktadır. Dağılımın dört parametresi BCPE (μ, σ, ν, τ) olarak özetlenmektedir. BCPE dağılımı parametrelerinin (μ, σ, ν, τ) farklı değerleri Şekil 2.4’te grafikler ile gösterilmekte olup, bu dört dağılım parametresi eğrinin şeklini belirlemektedir. Tüm grafiklerde ortalama μ=10 olarak belirlenmiş olup, (σ, ν, τ) 24 parametrelerinin farklı değerleri için dağılım özetlenmiştir. İlk sıradaki grafikte dağılımın yaygınlığındaki (σ) değişim, ikinci sıradaki grafikte dağılımın çarpıklığındaki (ν) değişim, son sıradaki grafikte ise dağılımın basıklığındaki (τ) değişim gösterilmektedir. σ değeri arttıkça dağılımın yaygınlığı artmakta olup, dağılımın çarpıklığındaki değişim (ν < 1 olduğunda pozitif çarpık ve ν > 1 olduğunda negatif çarpık) olarak ve dağılımın basıklığındaki değişim (τ < 2 olduğunda daha fazla basık – leptokurtosis ve τ > 2 olduğunda daha az basık – platykurtosis) olarak özetlenmektedir. Dağılımın yapısı grafiklerden de görüldüğü üzere 𝜈 = 1 olduğunda simetrik dağılım, 𝜏 = 2 olduğunda ise normal dağılım sergilediği görülmektedir (33). 𝑩𝑪𝑷𝑬 (𝝁 = 𝟏𝟎, 𝝈 = 𝟎. 𝟏, 𝝂 = 𝟏, 𝝉 = 𝟐) 𝑩𝑪𝑷𝑬 (𝝁 = 𝟏𝟎, 𝝈 = 𝟎. 𝟓, 𝝂 = 𝟏, 𝝉 = 𝟐) 𝑩𝑪𝑷𝑬 (𝝁 = 𝟏𝟎, 𝝈 = 𝟎. 𝟏, 𝝂 = 𝟎. 𝟓, 𝝉 = 𝟐) 𝑩𝑪𝑷𝑬 (𝝁 = 𝟏𝟎, 𝝈 = 𝟎. 𝟏, 𝝂 = 𝟓, 𝝉 = 𝟐) 𝑩𝑪𝑷𝑬 (𝝁 = 𝟏𝟎, 𝝈 = 𝟎. 𝟏, 𝝂 = 𝟏, 𝝉 = 𝟏. 𝟓) 𝑩𝑪𝑷𝑬 (𝝁 = 𝟏𝟎, 𝝈 = 𝟎. 𝟓, 𝝂 = 𝟏, 𝝉 = 𝟒. 𝟓) Şekil 2.4. BCPE dağılımının farklı değerleri için dağılım grafikleri 6 8 10 12 14 0. 0 0. 1 0. 2 0. 3 0. 4 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 1, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 05 0 0. 06 0 0. 07 0 0. 08 0 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.5, nu = 1, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 04 2 0. 04 4 0. 04 6 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 1, nu = 1, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 03 40 0. 03 45 0. 03 50 0. 03 55 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 1.5, nu = 1, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 0 0. 1 0. 2 0. 3 0. 4 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 0.5, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 0 0. 1 0. 2 0. 3 0. 4 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 5, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 0 0. 1 0. 2 0. 3 0. 4 0. 5 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 7, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 0 0. 1 0. 2 0. 3 0. 4 0. 5 0. 6 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 10, tau = 2) y pd f, f(y ) 6 8 10 12 14 0. 0 0. 1 0. 2 0. 3 0. 4 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 1, tau = 1.5) y pd f, f(y ) 6 8 10 12 14 0. 00 0. 05 0. 10 0. 15 0. 20 0. 25 0. 30 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 1, tau = 4.5) y pd f, f(y ) 6 8 10 12 14 0. 00 0. 05 0. 10 0. 15 0. 20 0. 25 0. 30 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 1, tau = 7) y pd f, f(y ) 6 8 10 12 14 0. 00 0. 05 0. 10 0. 15 0. 20 0. 25 0. 30 Box-Cox Power Exponential, BCPE BCPE( mu = 10, sigma = 0.1, nu = 1, tau = 8) y pd f, f(y ) 25 Aynı zamanda Rigby ve Stasinopoulos tarafından antropometrik ölçümdeki çarpıklığı ve daha yüksek basıklığı modelleyebilen BCT dağılımı geliştirilmiştir. Yine aynı şekilde, dağılım parametreleri BCT (μ, σ, ν, τ) olarak özetlenmektedir. Fakat BCPE dağılımı için hem daha esnek eğrilerin elde edildiği hem de daha fazla ve daha az basık olan antropometrik ölçüm için modelleme yapabildiğini de vurgulamışlardır. Y değişkeni BCPE (μ, σ, ν, τ) dağılımına sahip pozitif rastgele bir değişken olarak tanımlandığında, Box-Cox dönüşümü sonrasında rastgele değişken Z olarak eşitlik 2.39.’da gösterilmektedir (0 < Y < ∞), (μ > 0, σ > 0, τ > 0). 𝑍 = { 1 𝜎𝜈 [( 𝑌 𝜇 ) 𝜈 − 1] 𝜈 ≠ 0 1 𝜎 𝑙𝑜𝑔 ( 𝑌 𝜇 ) 𝜈 = 0 (2.39.) Standart bir kuvvet üstel (power exponential) değişkeni Z’nin olasılık yoğunluk fonksiyonu eşitlik 2.40.’ta tanımlanmaktadır (-∞ < 𝑧 < ∞), (𝜏 > 0). Bu denklem ile 𝜏 > 0 olduğu durum için Z’nin ortalamasının 0 ve standart sapmasının 1 olması sağlanır. 𝜏 = 1 olması durumunda Laplace dağılımına, 𝜏 = 2 olması durumunda ise normal dağılıma hatta LMS yöntemine karşılık gelmektedir. 𝑓𝑍(𝑧) = 𝜏 𝑐2(1+1/𝜏)Г(1/𝜏) exp {−0.5|𝑧/𝑐|𝜏 (2.40.) Y’nin olasılık yoğunluk fonksiyonu eşitlik 2.41.’te verilmektedir. 𝑓𝑌(𝑦) = 𝑓𝑍(𝑧) | 𝑑𝑧 𝑑𝑦 | = 𝑦𝜈−1 𝜇𝜈𝜎 𝑓𝑍(𝑧) (2.41.) 26 BCPE dağılımında eşitlik 2.35.’te belirli bir ortalama ve standart sapma için (𝜈 = 1) olduğunda simetrik dağılım, (ν < 1) olduğunda pozitif çarpık dağılım, (ν > 1) olduğunda negatif çarpık dağılım olarak elde edilmektedir (9). Açıklayıcı X değişkeni için X=x verildiğinde, Y ölçüm değişkeni BCPE (μ, σ, ν, τ) dağılımı ile modellenir. Dağılımın dört parametresi x’in düzleştirilmiş parametrik olmayan fonksiyonları olarak eşitlik 2.42.’de verilmiştir. 𝑔1(𝜇) = ℎ1(𝑥) 𝑔2(𝜎) = ℎ2(𝑥) 𝑔3(𝜈) = ℎ3(𝑥) 𝑔4(𝜏) = ℎ4(𝑥) (2.42.) Bu eşitlikte k=1,2,3,4 için 𝑔𝑘(. ) değeri monoton bağlantı fonksiyonudur. ℎ𝑘(𝑥) ise 𝑥’in düzleştirilmiş parametrik olmayan fonksiyonudur ve bu fonksiyonlar eşitlik 2.43.’te verildiği gibi, ℓ𝑝 cezalandırılmış olabilirlik fonksiyonunun maksimize edilmesiyle tahmin edilir. ℓ𝑝 = ℓ𝑑 − 1 2 ∑𝜆𝑘∫ {ℎ𝑘 ′′(𝑢)}2𝑑𝑢 ∞ −∞ 4 𝑘=1 (2.43.) Modelin özetlenmesi hem BCPE dağılımı hem de BCT dağılımı için aynı olup BCPE (𝑑𝑓𝜇, 𝑑𝑓σ, 𝑑𝑓ν, 𝑑𝑓τ, λ) olarak ifade edilmektedir. Bu gösterimdeki ilk dört parametre μ, σ, ν, τ için ℎ1(𝑥) ve ℎ4(𝑥) arasındaki düzleştirilmiş parametrik olmayan fonksiyonlarda kullanılan toplam etkili serbestlik derecesini, son parametre λ ise kuvvet dönüşümünü göstermektedir (9-10). 2.7. Worm Grafiği (Worm Plot) Worm (solucan) grafiği, istatistiksel bir modelin veriye uyumunu değerlendirmek ve farklı modellerin uyumunu karşılaştırmak için kullanılan bir tanı 27 aracıdır. Büyüme eğrilerinde worm grafiği, uydurulan (fit edilen) modelde antropometrik ölçümlerin yaşa bağlı normalliğini değerlendirmektedir. LMS, LMSP ve LMST yöntemlerinde Box-Cox dönüşümü sonrasında ölçüm değerleri her yaşta normal dağılım göstermekte olup, büyüme eğrilerinin oluşturulmasında yaşa bağlı düzgün eğrilerin seçilmesi önemlidir. Düzleştirme parametreleri ile wormların belirli şekilleri arasında yakın bir ilişki vardır. Bu düzleştirme parametrelerinin seçiminin uygunluğunun değerlendirilmesinde worm grafikleri destekleyici araçlardır (12). Worm grafiğinin oluşturulmasında parametrik dağılım varsayımlarına ihtiyaç duyulmadığından kantil regresyon yönteminde de kullanılmaktadır. Kantil regresyon ve LMS yöntemleri ile oluşturulan worm grafikleri aynı amaç için oluşturulmuş olup kantil regresyon yöntemi herhangi bir dağılım varsayımı gerektirmezken, LMS yöntemi yaşa bağlı Box-Cox dönüşümünden sonra ölçümün normal olarak dağıldığı varsayımını gerektirir (34). Q-Q grafiği ile dağılımın normal dağılıma uygunluğu değerlendirilmektedir. Q-Q grafiği, gözlenen değerlere (x-ekseni) karşın beklenen normal değere (y-ekseni) göre çizilmekte olup, verilere iyi uyan modellerde veri noktaları bir doğru etrafında kümelenerek düz bir çizgi oluşturur. Veri noktaları çizgiye ne kadar yakınsa artıkların dağılımı standart normal dağılıma o kadar yakın olur. Bu çizgiden sapmalar ise doğrusallıktan sapmayı ve veriye uyumun derecesini göstermektedir. Worm grafiği her bir yaş grubu için bir dizi detrended Q-Q grafiğinin toplamından oluşmakta olup, grafiğin dikey ekseni her gözlem için gözlenen ile beklenen arasındaki farkları göstermektedir (12). Worm grafikleri, uydurulan eğrilerdeki model uyumsuzluklarını ve yanlılıkları saptamak için kullanılmaktadır. Worm grafiğinin yorumlanması Tablo 2.2.’de özetlenmektedir. Grafikte her bir worm %95 güven aralığında verilmektedir. Tüm veri seti için worm grafiğinin oluşturulması genel modelin uyumu hakkında bilgi verirken, yaş gruplarına göre modelin uyumunu değerlendirmemektedir. Her bir grafik panelinde belirlenen yaş gruplarına göre worm grafikleri verilir ve böylelikle farklı yaş grupları için modelin uyumu değerlendirilir. Bu veri noktaları solucan benzeri çizgi oluşturur ve bu çizgiler verilerin varsayılan dağılımdan ne kadar farklı olduğunu gösterir (12). 28 Worm grafiklerinde yaş gruplarının sayısının artmasıyla daha ayrıntılı görüntü sağlanır, ancak grafiğin çözünürlüğünde azalma olur. Bu nedenle, grafiğin çözünürlüğü de göz önünde bulundurularak uygun bir n x n matris görüntüsünde grafik belirlenir. Worm grafiğinde en düşük yaş aralığı sol alt köşeden başlar ve sağa doğru artan yaş grupları olarak devam eder, en üst sağ köşede ise en yüksek yaş grubu ile son bulur (12). Bu tez kapsamında kullanılan veride kız çocukların baş çevresi ölçümlerine ilişkin iyi belirlenmemiş etkili serbestlik derecesi için seçilen modelin genel uyumu ve farklı yaş grupları için model uyumu worm grafikleri ile Şekil 2.5’te sunulmuştur. İlk grafikte kızların baş çevresi ölçümlerine ilişkin genel model uyumu verilirken, alttaki (1 x 4) matris formatında verilen grafikte soldan sağa doğru 1 ay - 4 ay arasındaki kız çocuklarının baş çevreleri ölçümlerinin model uyumu verilmiştir. İyi belirlenmeyen etkili serbestlik derecesinin de farklı yaş grupları için ayrı ayrı worm grafiklerinde değerlendirildiğinde model uyumunun kötü olduğu görülmektedir. Aynı zamanda grafikte veri noktaları %95 güven aralığı dışında yer aldığından, seçilen model için uydurulan dağılımının baş çevresini açıklamada yetersiz olduğu söylenebilir. Şekil 2.5. Worm grafiğinin model uyumunun incelenmesi 29 Tablo 2.2. Worm Grafiğinin Yorumlanması Şekil Moment Worm Grafiğinin Yorumlanması Keşisen Ortalama Worm orijinin üstünden geçerse, uydurulan ortalama oldukça küçüktür. Worm orijinin altından geçerse, uydurulan ortalama oldukça büyüktür. Eğim Varyans Worm pozitif bir eğime sahipse, uydurulan varyans oldukça küçüktür. Worm negatif bir eğime sahipse, uydurulan varyans oldukça büyüktür. Parabol Çarpıklık Worm U şeklinde ise, uydurulmuş dağılım sola çarpıktır. Worm ters U şeklinde ise, uydurulmuş dağılım sağa çarpıktır. S-eğrisi Basıklık Worm solda aşağı doğru S şeklinde ise, uydurulan dağılımın kuyrukları oldukça dardır. Worm solda yukarı doğru S şeklinde ise, uydurulan dağılımın kuyrukları oldukça aşırıdır. Antropometrik ölçüm verilerini düzleştirmek için etkili serbestlik derecelerinin belirlenmesi model uyumunda oldukça önemlidir. LMS yönteminde etkili serbestlik dereceleri ile worm şekilleri arasında yakından ilişki vardır. Wormların şekli, model ve veri arasındaki uyumsuzluğu gösterir. Worm grafikleri, grafik paneli dışında kalan noktalar için modelin yeterli uyum göstermediği hatta grafik panelinin boş kalması durumunda ise modelin kötü uyum gösterdiği bilgisini sunmaktadır. Etkili serbestlik derecelerinde gerçekleşen küçük değişimde uydurulan eğrilerin değişimini görmek ya da eğrilerin verilere ne kadar uyum gösterdiğini değerlendirmek güçken, worm grafiği model uyumunu değerlendirmede basit ve iyi bir görsel araçtır (12). 2.8. Kantil Regresyon (Quantile Regression) Yöntemi Yaşa bağlı olarak çocukların antropometrik ölçümleri normal dağılım göstermediğinden LMS yönteminde normalliği sağlamak için yaş üzerinde Box-Cox kuvvet dönüşümü yöntemi kullanılmıştır. Koenker ve Bassett (11) tarafından 30 büyüme grafiklerinin oluşturulmasında veride dağılım varsayımının aranmadığı alternatif bir yöntem olarak kantil regresyon yöntemi geliştirilmiştir. Kantil regresyonu, bağımlı değişken için dağılım varsayımı aramadığından parametrik olmayan bir yöntemdir. En küçük kareler regresyonunda artıkların kareler toplamını minimum yapan regresyon katsayıları hesaplanır ve koşullu ortalama tahmin edilir. Eşitlik 2.44.’te gösterildiği gibi v değeri y’lerin aritmetik ortalamasına eşit bir değerse kareler toplamı en aza indirgenir. ∑(𝑦𝑖 − 𝑣) 2 (2.44.) Eğer v değeri medyana eşitse mutlak sapmanın toplamı en aza indirgenir ve eşitlik 2.45.’te tanımlanmıştır. ∑|𝑦𝑖 − 𝑣| (2.45.) Medyan regresyon, artıkların mutlak değerlerinin toplamını en küçük yapan regresyon katsayılarını bulur. Medyan regresyon, τ=0.5 ile kantil regresyonun özel hali olup en aza indirgenen artıkların ağırlıksız mutlak değerlerinin toplamıdır. Ağırlığın tanımı eşitlik 2.46.’da verilmiştir ve τ=0.5 için ağırlık sabit olup medyan regresyonuna indirgenir. Eşitlik 2.47.’de verildiği gibi kantil regresyon ağırlıklı mutlak artıkların toplamını en aza indirger (35). 𝑤𝑖 = { 2𝜏, 𝑒𝑖 > 0 2(1 − 𝜏), 𝑑𝑖ğ𝑒𝑟 𝑑𝑢𝑟𝑢𝑚𝑙𝑎𝑟𝑑𝑎 } (2.46.) ∑|𝑒𝑖| 𝑤𝑖 (2.47.) 31 2.8.1. Doğrusal Kantil Regresyon Modeli 𝑌 ilgilenilen bağımlı değişkeni ve 𝑋 ilgilenilen ortak değişkenlerin vektörünü temsil etmektedir. Klasik doğrusal regresyon modelinde 𝐸(𝑌 | 𝑋) = 𝑋′𝛽 formunda 𝑋’in koşullu ortalaması modellenir. 𝛽 regresyon katsayıları, 𝑋’in birim artışından dolayı 𝑌’deki değişiklik miktarı olarak yorumlanır. Kantil regresyonda, 𝑋’in doğrusal bir fonksiyonu olarak 𝑌’nin koşullu kantili modellenir. Doğrusal koşullu kantil modeli eşitlik 2.48.’de verildiği gibi tanımlanmaktadır. 𝑄𝑌(𝜏 | 𝑋) = 𝑋 ′𝛽(𝜏) (2.48.) Burada 𝑄𝑌(𝜏 | 𝑋), ortak değişken 𝑋 verildiğinde 𝑌’nin 𝜏. kantili anlamındadır. 𝜏 (0, 1) arasında değişken kantil düzeyini göstermektedir. Örneğin, 𝑌’nin medyanı yani 50. persentil modellendiğinde 𝜏 = 0.5’e eşit olacaktır. 𝛽(𝜏) kantil katsayı değeri 𝑋’teki bir birimlik artışta 𝜏. kantildeki değişim olarak yorumlanmaktadır. 𝛽(𝜏) her bir kantil düzeyinde ayrı ayrı tahmin edildiğinden dolayı veride herhangi bir dağılım varsayımını gerektirmez. Bu nedenle, kantil regresyon esnek bir modelleme aracıdır. Medyan dışındaki kantil katsayılarının tahminleri, eşitlik 2.49.’da tanımlanan fonksiyonun tüm olası 𝛽 üzerinde en aza indirgeyerek elde edilmektedir (36). �̂�(𝜏) = 𝑎𝑟𝑔𝑚𝑖𝑛∑𝑖 𝜌𝜏(𝑦𝑖 − 𝑋𝑖𝛽) (2.49.) 2.8.2. Doğrusal Olmayan Kantil Regresyon Modeli Veride herhangi bir dönüşüm yönteminin normalliği sağlayamadığı durumda dağılım üzerinde katı varsayımlar gerektirmeyen alternatif yöntemler üzerinde çalışılmıştır. Bu amaç için parametrik olmayan kantil regresyon problemlerinin çözümü ile koşullu kantil fonksiyonları tahmin edilmiştir ve bu fonksiyon eşitlik 2.50.’de verilmiştir. 32 𝑚𝑖𝑛 𝑔𝜖ԍ ∑𝜌𝜏(𝑌(𝑡𝑖) − 𝑔( 𝑛 𝑖=1 𝑡𝑖)) (2.50.) 𝜌𝜏 fonksiyonu basit parçalı doğrusal fonksiyonu ifade etmekte olup eşitlik 2.51.’de verilmiştir. Fonksiyonun parçalı doğrusal formu, uydurulan eğrinin altında ve üzerinde bulunan gözlem sayısı arasında bir denge sağlama etkisine sahiptir. 𝜌𝜏(𝜇) = 𝜇(𝜏 − 𝐼(𝜇 < 0)) = { 𝜏𝜇 𝜇 ≥ 0 (𝜏 − 1)𝜇 𝜇 < 0 } (2.51.) Koenker ve Bassett, 𝑛 büyüklüğünde örneklem verildiğinde {(𝑋𝑖, 𝑌𝑖), 𝑖 = 1,… , 𝑛} doğrusal kantil modelden (𝑄𝑌(𝜏|𝑋 = 𝑥) = 𝑥𝑇𝛽𝜏) 𝜏. regresyon kantil katsayısının tahminini eşitlik 2.52.’de verildiği gibi tanımlamıştır. �̂�𝜏 = 𝑎𝑟𝑔𝑚𝑖𝑛𝛽𝜖𝑅𝑝 {∑𝜌𝜏(𝑌𝑖 − 𝑋𝑖 𝑇𝛽) 𝑛 𝑖=1 } (2.52.) Kantil regresyon yönteminde tahmin edici mutlak artıkların toplamını minimize etmektedir (37-38). 2.8.3. Cezalandırılmış Spline’lar İle Parametrik Olmayan Kantil Regresyon 𝑛 kişiden oluşan bir örneklem için 𝑥1, … , 𝑥𝑛 yaş tahmin değerleri ile 𝑦1, … , 𝑦𝑛 antropometrik ölçüm sonucu elde edilen değer yani bağımlı değişken olarak düşünüldüğünde, parametrik olmayan kantil regresyon koşullu %100𝜏. kantil olarak 𝑔(𝑥) olarak tanımlanan düzgün fonksiyonunu tahmin etmeye çalışır. Yaygın genel bir yaklaşım, eşitlik 2.53.’te verilen uygun bir fonksiyon üzerinde minimize eden bir �̂� = �̂�𝜏,𝜆 formu tahmin edilmektedir (39). ∑𝜌𝜏[𝑦𝑖 − 𝑔(𝑥𝑖)] + 𝜆𝑱(𝑔) 𝑛 𝑖=1 (2.53.) 33 Koenker ve Bassett tarafından 𝜌𝜏 kontrol fonksiyonu olarak tanımlanmıştır ve eşitlik 2.54.’te verilmektedir. 𝜌𝜏(𝜇) = 𝜏𝜇 + + (1 − 𝜏)𝜇− (2.54.) Burada, 𝜇+ = max(𝜇, 0) ve 𝜇− = max(−𝜇, 0), 𝑱(𝑔) pürüzlülük fonksiyonları olup 𝜆 ise bir ayar parametresidir ve pürüzlülüğün ne ölçüde cezalandırılacağını belirlemektedir. 2.8.4. P-spline Kullanımı İle En Küçük Kareler Regresyon Yöntemi P-spline kullanarak en küçük kareler regresyonunda aşırı uyumu düzeltmek için fazla sayıda eşit aralıklı tek değişkenli B-splinelar ve ek bir ceza gereklidir. Böylelikle hem eğrilerde düzgünleştirme hem de aşırı uyumun önüne geçilmektedir (26). ∝ vektörü en küçük kareler kayıp fonksiyonu veya 𝐿2-normu olarak tahmin edilmektedir ve eşitlik 2.55.’te verilmiştir. 𝑆2 = ∑(𝑦𝑖 − �̂�(∝)𝑖) 2 𝑚 𝑖=1 (2.55.) 𝐿2-normuna dayanan kayıp fonksiyonu eşitlik 2.56.’da tanımlanmıştır. 𝑆2 = ∑(𝑦𝑖 − �̂�(∝)𝑖) 2 𝑚 𝑖=1 + 𝜆 ∑ (∆𝑑∝𝑗) 2 𝑟 𝑗=𝑑+1 (2.56.) Burada, ∆𝑑∝𝑗 ile 𝑑. dereceden farklar şöyle ki ∆𝑑∝𝑗 = ∆ 1( ∆𝑑−1∝𝑗) ile ∆1∝𝑗 = ∝𝑗 − ∝𝑗−1 formunda tanımlanmakta olup λ düzleştirme parametresidir. Düzleştirme parametresi küçük olduğunda düzgünlük cezası uyumu zayıf bir şekilde etkiler. Tam tersi büyük olduğunda ise düzgünlük cezası uyumu büyük ölçüde etkilemektedir. 34 P-spline yaklaşımı monotonluğun sağlanmasında kullanılmakta olup, birinci dereceden farklara ek bir asimetrik ceza eklenerek yapılabilmektedir. Monotonluğun sağlanmasında 𝐿2-kayıp fonksiyonu eşitlik 2.57.’de tanımlanmıştır. 𝑆2 = ∑(𝑦𝑖 − �̂�(∝)𝑖) 2 𝑚 𝑖=1 + 𝜆 ∑ (∆2∝𝑗) 2 𝑟 𝑗=𝑑+1 + 𝜅∑𝑤(∝𝑗)(∆ 1∝𝑗) 2 𝑟 𝑗=2 𝑤(∝𝑗) = { 0 𝑒ğ𝑒𝑟 ∆1∝𝑗≥ 0 (𝑠𝚤𝑟𝑎𝑠𝚤𝑦𝑙𝑎 ∆ 1∝𝑗≤ 0 1 𝑑𝑖ğ𝑒𝑟 𝑑𝑢𝑟𝑢𝑚𝑙𝑎𝑟𝑑𝑎 } (2.57.) Burada 𝜅 ile tanımlanan kısıtlama parametresidir. 𝜅 = 0 için monotonluk uygulanmaz. 2.8.5. P-spline Kullanımı İle Kantil Regresyon Yöntemi Klasik en küçük kareler regresyonda koşullu ortalama fonksiyonları artık kareler toplamının yani 𝐿2 normunun en az indirgenmesiyle tahmin edilirken, kantil regresyonda koşullu kantil fonksiyonları mutlak sapmaların toplamının yani 𝐿1 normunun en aza indirgenmesiyle tahmin edilmektedir. Koşullu kantil fonksiyonları, koşullu ortalama fonksiyonları ile karşılaştırıldığında, kantil fonksiyonlarının bağımlı değişkendeki aykırı gözlemlere karşı daha sağlam olduğu belirtilmektedir. Pediatrik büyüme eğrilerinin tahmininde, çocukların antropometrik ölçümleri yaşın bir fonksiyonu olarak kantil referans büyüme eğrileri ile tahmin edilmektedir. Kantil regresyon yöntemi parametrik varsayım koşullarını gerektirmediğinden ikinci dereceden ya da logaritmik fonksiyon gibi parametrik varsayımları sağlamadan çocukların antropometrik ölçümlerinin yaşın monoton artan bir fonksiyonu olarak varsayılmaktadır (26). Kantil regresyonda ∝ asimetrik en küçük mutlak sapma fonksiyonu veya asimetrik 𝐿1 normu olarak adlandırılmaktadır ve 𝐿1 normunun en aza indirgenerek tahmin edilmesi eşitlik 2.58.’de verilmiştir. 35 𝑆1 = 𝜃 ∑ |𝑦𝑖 − �̂�(∝)𝑖| + (1 − 𝜃) 𝑦𝑖≥�̂�(∝)𝑖 ∑ |𝑦𝑖 − �̂�(∝)𝑖| 𝑦𝑖<�̂�(∝)𝑖 (2.58.) Burada, pozitif değerler 𝜃 faktörü ile ağırlıklandırılırken, negatif değerler 1 − 𝜃 faktörü ile ağırlıklandırılmaktadır. 𝐿1 normunun daha iyi bir gösterimi ve 𝜌𝜃 kontrol fonksiyonu eşitlik 2.59.’da ve eşitlik 2.60.’ta gösterilmektedir. 𝑆1 = ∑𝜌𝜃(𝑦𝑖 − 𝑚 𝑖=1 �̂�(∝)𝑖) (2.59.) 𝜌𝜃(𝜏) = { 𝜃𝜏 𝜏 ≥ 0 (𝜃 − 1)𝜏 𝑑𝑖ğ𝑒𝑟 𝑑𝑢𝑟𝑢𝑚𝑙𝑎𝑟𝑑𝑎 } (2.60.) B-splineları kullanarak koşullu kantil fonksiyonlarına uydurmak için asimetrik en küçük mutlak sapmaların kayıp fonksiyonu (�̂�(∝)𝑖 = ∑ ∝𝑗 𝐵𝑗(𝑥𝑖, 𝑞), 𝑖 = 1,… ,𝑚 𝑟 𝑗=1 ) tanımlandığı denklemde �̂�(∝)𝑖 ile Eşitlik 2.59.’a eşittir. Bu durumda P-spline regresyonu yani eşit aralıklı B-splinelar ve ek bir düzleştirme parametresi ile kayıp fonksiyonu eşitlik 2.61.’de verildiği gibi genişletilmektedir. 𝑆1 =∑𝜌𝜃(𝑦𝑖 − �̂�(∝)𝑖) + 𝜆 ∑ |∆𝑑∝𝑗| 𝑟 𝑗=𝑑+1 𝑚 𝑖=1 (2.61.) Burada ∆𝑑∝𝑗 ile gösterilen 𝑑. dereceden farklardır ve 𝜆 düzleştirme parametresidir. P-splinelar ile kantil regresyon monotonluğu uygulamak için eşitlik 2.62.’de verildiği gibi genişletilebilir. 𝑆1 =∑𝜌𝜃(𝑦𝑖 − �̂�(∝)𝑖) + 𝜆 ∑ |∆𝑑∝𝑗| 𝑟 𝑗=𝑑+1 + 𝜅∑𝑤(∝𝑗)|∆ 1∝𝑗| 𝑟 𝑗=2 𝑚 𝑖=1 (2.62.) 36 Burada 𝑤(∝𝑗) asimetrik ağırlıklar olup ve sadece 𝜅 kısıtlı parametre ile tanımlı cezalandırmadır (26). 2.8.6. Kesişmeyen ve Monoton Kantil Eğrilerinin Tahmini Kantil regresyon, parametrik fonksiyonlar ve herhangi bir varsayıma dayanmadan kantiller üzerinde ortak değişkenin etkilerini modellemeyi amaçlamaktadır. Y bağımlı değişkeni ve 𝜏𝑘 𝜖 (0, 1) yüzdeliği için kantil regresyon modeli eşitlik 2.63.’te tanımlanmıştır. 𝑄𝜏𝑘(𝑌|𝑧𝑖, 𝑥𝑖) = 𝑥𝑖 𝑇𝛽𝜏𝑘 + 𝑠𝜏𝑘(𝑧𝑖) (2.63.) Burada, 𝛽𝜏𝑘 p ortak değişkenlerinin doğrusal etkisini göstermekte olup 𝑠𝜏𝑘(𝑧𝑖) ise kantilleri z yaş değişkeni ile ilişkilendiren düzleştirilmiş fonksiyonlardır. 𝑠𝜏𝑘(. ) terimi 𝑧𝑖 ortak değişkeninin doğrusal olmayan etkisini açıklamakta olup, belirlenen 𝜏𝑘 persentillere karşılık gelen yaşa özgü büyüme çizelgelerini tanımlayan B-splinelar aracılığıyla ifade edilir ve 𝑠𝜏𝑘(. ) = ∑ 𝑏𝑗𝑘𝐵𝑗(. ) 𝐽 𝑗 denklemi J temel fonksiyonlarının doğrusal bir kombinasyonu olarak tanımlanmaktadır. B-splineların kullanılması eşitlik 2.63.’ün 𝑥𝑖 𝑇𝛽𝜏𝑘 + 𝐵(𝑧𝑖) 𝑇𝑏𝑘 tanımlanan doğrusal formda yazılmasını sağlamaktadır. Eşitlik 2.63.’te verilen denklemin minimize edilmesi için amaç fonksiyonu eşitlik 2.64.’te tanımlanmıştır. Burada 𝜌𝜏 normal kontrol fonksiyonudur. ℒ(𝑏, 𝛽) =∑𝜌𝜏(𝑦𝑖 − 𝐵𝑖 𝑇𝑏 𝑖 − 𝑥𝑖 𝑇𝛽) (2.64.) Ayrıca, çok fazla sayıda temel fonksiyondan kaynaklanan aşırı uyumu önlemek için spline katsayılarına uygun cezalar eklenmektedir. Cezalandırılmış fonksiyon eşitlik 2.65.’te tanımlanmaktadır. 37 ℒ𝜆(𝑏, 𝛽) =∑𝜌𝜏(𝑦𝑖 − 𝐵𝑖 𝑇𝑏 − 𝑖 𝑥𝑖 𝑇𝛽) +∑𝜆𝑗‖𝐷𝑗 𝑑𝑏𝑗‖1 𝑗 (2.65.) Bu eşitlikte ceza ‖𝐷𝑗 𝑑𝑏𝑗‖1 , katsayı farklarının mutlak değerlerinin ve 𝜆𝑗 düzleştirme parametresinin toplamıdır (40-41). 2.8.7. Kesişmeyen (Non-crossing) Kantil Eğrilerinin Tahmini Kantil regresyon eğrileri ayrı ayrı tahmin edildiğinden, eğrilerde kesişme söz konusu olabilir bu durum bağımlı değişken için yanlış bir tahmine sebep olabilir. Kantil regresyon yöntemi, en küçük kareler regresyon yönteminin varsayımlarının sağlanmadığı koşullar için geliştirilmiş yöntem olup, ortalama yerine medyan ile modellenmektedir. Böylelikle uzak gözlem değerlerine karşı daha güçlüdür. Kantil eğrilerinin uydurulmasında, kıt / az veriden kaynaklı olarak üst eğrilerin uydurulmasında problem yaşanabilmektedir (42). Eğrilerde kesişme problemi ile başa çıkmak için Cole ve Green tarafından LMS yönteminde, Box-Cox dönüşümü ile veride normal dağılımın sağlanacağı varsayımında, konum ve ölçek fonksiyonları ile birlikte dönüşümün parametrik olmayan tahminleri elde edilmiştir. Kantil regresyon yönteminde ise kantil eğrilerinde kesişme problemini önlemek için ekstra işlemlere ihtiyaç duyulmaktadır (40-42). Genel regresyon denklemi eşitlik 2.66.’da tanımlandığı gibi verildiğinde, 𝜏1, … , 𝜏2𝐾+1 sıralı persentillere karşılık gelen regresyon kantilleri 𝑄1, 𝑄2, … , 𝑄2𝐾+1 olarak belirtilmiştir. 𝑄𝑘 = 𝑤𝑇𝜃𝑘 (2.66.) Eğrilerde kesişmeme, herhangi bir 𝑄𝑘+1 ve 𝑄𝑘 gibi komşu kantil eğrileri için 𝑄𝑘+1 > 𝑄𝑘 formunda sabitler, bu da 𝜃𝑘+1 > 𝜃𝑘 anlamına gelmektedir. Doğrusal eşitsizlik kısıtlamaları bilinen bir R matrisi ve r vektörü açısından yani 𝑅𝜃𝑘+1 ≥ 𝑟 olarak yazılır ve böylelikle kantil eğrilerindeki kesişmeyi önlemek için 𝑅 = 𝐼 birim matrisi 38 ve 𝑄𝑘 referans kantil eğrisinin varsayılan parametre vektörünü 𝑟 = 𝜃𝑘 olarak ayarlanmıştır. 𝑄𝑘 verildiğinde, 𝜃𝑘+1 parametrelerine standart doğrusal eşitsizlik kısıtlamaları uygulanarak bir sonraki kesişmeyen 𝑄𝑘+1 eğrisi tahmin edilebildiği gibi 𝑅 = −𝐼 ve 𝑟 = −𝜃𝑘 ile 𝜃𝑘−1 < 𝜃𝑘 kısıtlamaları dikkate alınarak önceki kesişmeyen 𝑄𝑘−1 eğrisi tahmin edilir. Bu nedenle, uydurulmuş eğriler arasındaki kesişmeyi önlemek için, komşu eğri katsayılarına sıralı doğrusal eşitsizlik kısıtlamaları uygulanarak farklı regresyon kantillerini uydurmak sezgisel bir yaklaşımdır. Bu algoritma ile başlangıç persentil 𝜏0 için kantil regresyon modeli tahmin edilir ve her bir kantil eğrisi 𝜏0’dan başlayarak her bir adımda kesişmemenin sağlanması için referans değeri olarak bir önceki kantil eğrisinin parametre tahminlerini kullanarak kantil eğrilerini sırasıyla tahmin etmektedir (40). 2.8.8. Monoton Kantil Eğrilerinin Tahmini Doğrusal olmayan 𝑠𝑘(. ) fonksiyonunu tanımlamak için B-splinelar kullanıldığında uydurulan eğri üzerindeki monotonluk kısıtlamaları doğrudan açıklanabilmektedir. Komşu katsayıların birinci dereceden farklarının negatif olmamasından dolayı B-spline katsayıları monotonluğu sağlamak için yeterli koşul olup 𝑘. kantil eğrisi 𝑗 = 1,… , 𝐽 − 1 için 𝑏𝑘,𝑗+1 − 𝑏𝑘,𝑗 olarak tanımlanmaktadır. 𝐷𝑏𝑘 ≥ 0 doğrusal eşitsizlik kısıtlamaları olup 𝐷, (𝐽 − 1)𝑥𝐽 birinci dereceden fark matrisi eşitlik 2.67.’de tanımlanmıştır. 𝐷 = [ −1 1 0 … 0 0 −1 1 … 0 ⋮ ⋱ ⋮ 0 0 −1 1 ] (2.67.) Bu doğrusal eşitsizlik kısıtlamaları, spline katsayıları üzerinde monotonluk kısıtlamaları ile kesişmeyen kantil eğriler eşitlik 2.68.’de tanımlanan 𝑅 matrisini ve 𝑟 vektörlerini gerektirir (40). 𝑅 = [ 𝐼(𝑝+𝐽)𝑥(𝑝+𝐽) … 0(𝐽−1)𝑥𝑝|𝐷(𝐽−1)𝑥𝐽 ] 𝑟 = [ �̂�𝑝𝑥1 �̂�𝐽𝑥1 0(𝐽−1)𝑥1 ] (2.68.) 39 2.8.9. Kantil Regresyonda Düzleştirme Parametresinin Seçimi Kantil regresyonda eğrinin düzgünlüğü en uygun 𝜆 değeri ile belirlenmektedir. Bunun için de Akaike bilgi kriteri (Akaike Information Criterion – AIC) ve çapraz geçerlilik (cross validation) yöntemleri önerilmiştir (25-27). Akaike Bilgi Kriteri (Akaike Information Criterion) Akaike bilgi kriteri (AIC) ölçütü bir modelin verilere ne kadar uyacağının ölçüsüdür. Eşitlik 2.69’da AIC tanımı verilmiştir (25). 𝐴𝐼𝐶(𝜆) = 𝑑𝑒𝑣(𝑦; 𝑎, 𝜆) + 2 ∗ 𝑑𝑖𝑚 (𝛼, 𝜆) (2.69.) Burada 𝑑𝑒𝑣(𝑦; 𝑎, 𝜆) sapma istatistiği, dim (α, λ) ise modelin etkili boyutudur. Çapraz Geçerlilik Çapraz geçerliliğin hesaplanması eşitlik 2.70.’te verilmiştir. Ç𝑎𝑝𝑟𝑎𝑧 𝐺𝑒ç𝑒𝑟𝑙𝑖𝑙𝑖𝑘 (𝜆) = ∑( 𝑦𝑖 − �̂�𝑖 1 − ℎ𝑖𝑖 ) 2𝑚 𝑖=1 (2.70.) Schwartz Bilgi Kriteri (Schwartz Information Criterion) Koenker ve ark. (43) ile He ve Ng (44) çalışmalarında kantil düzleştirme spline problemi için Schwarz’ın kriterinin uygulamalarda iyi performans gösterdiğini belirterek, kantil düzleştirme splinelarında düzenleme parametrelerinin seçiminde Schwartz bilgi kriterini (Schwartz Information Criterion – SIC) önermişlerdir. Her bir kantil eğrisi için SIC kriteri eşitlik 2.71.’de verildiği gibi tanımlanmaktadır. 𝑆𝐼𝐶 (𝜆𝜏𝑡) = 𝑙𝑜𝑔 [𝑛 −1∑𝜌𝜏𝑡 {𝑦𝑖 − �̂�𝜏𝑡 𝜆𝜏𝑡(𝑥𝑖)} 𝑛 𝑖=1 ] + (2𝑛)−1𝑝𝜆𝜏𝑡log (𝑛) (2.71.) Burada 𝑔𝜏𝑡 𝜆𝜏𝑡 notasyonu, 𝜆𝜏𝑡’nin seçiminde tahmini fonksiyonu belirtmekte olup 𝑝𝜆𝜏𝑡 ise interpolasyonlu veri noktalarının sayısıdır (42). 40 Şekil 2.6. Düzleştirme parametresinin farklı değerlerinde baş çevresi için büyüme eğrileri Kantil regresyon yöntemi ile orijinal veri setinde baş çevresi ölçümü için büyüme eğrileri Şekil 2.6’da oluşturulmuştur. Soldan sırasıyla ilk grafikte veride herhangi bir düzleştirme parametresinin (λ) seçilmediği büyüme eğrisi, ikinci grafikte λ=7 olarak belirlendiğindeki büyüme eğrisi ve üçüncü grafik ise hem λ=7 hem de monotonluk kısıtlaması ile birlikte oluşturulan büyüme eğrisidir. Özellikle her bir kantil eğrisinde kesişme problemi ile başa çıkılmıştır. 41 3. GEREÇ VE YÖNTEM Bu tez çalışması kesitsel araştırma türünde olup tüm bulgular gerçek veri seti üzerinde gerçekleştirilmiştir. Çalışmanın etik kurul izni Hacettepe Üniversitesi Etik Kurulu tarafından onaylanmıştır (GO/757). Çalışmanın verileri için ise Başkent Üniversitesi Ankara Hastanesi’nden 31220125-20 / 10256 sayılı evrak numarası ile gerekli izinler alınmış olup Çocuk Sağlığı ve Hastalıkları Kliniği’nde muayene edilen çocuklar çalışmaya dahil edilmiştir. Ocak 2016 – Aralık 2021 yılları arasında hastanede aynı hekim tarafından muayene edilen 1673 kız ve 1647 erkek çocuk olmak üzere çalışmaya 0-3 yaş aralığında toplamda 3320 çocuk alınmıştır. Çocukların boy uzunluğu, vücut ağırlığı, baş çevresi ve BKİ ölçümleri kullanılmıştır. Hastaneden elde edilen ölçümler kapsamında boy uzunluğu, vücut ağırlığı ve BKİ ölçümlerinde çocukların ilk 36 aya kadar olan verileri kullanılırken baş çevresi ölçümlerinde ilk 24 aya kadar olan veriler kullanılmıştır. 3.1. Örneklem Sayısının Belirlenmesi Büyüme eğrilerinin oluşturulmasında her bir yaş grubunda yeterli büyüklükte örneklem yer almalıdır. Büyüme hızının yüksek olduğu bebeklik döneminde yaş gruplarının 1’er ay aralıklar ile gruplandırılması ve sonraki yıllar için ise her bir yaş aralığının mümkün olduğunca dar belirlenmesi gerektiği vurgulanmıştır. Cole, LMS yöntemi için her bir yaş aralığında en az 100 gözlem ile çalışılmasının iyi sonuç vereceğini belirtmiştir (7). Bu doğrultuda büyüme eğrileri oluşturulurken gerçek veride her bir yaş grubunda en az 100 örneklem olacak şekilde örneklem sayısı belirlenmiştir. Yaş grupları ise çocukların ilk 6 ay için birer ay aralıklar ile sonrasında 18 aya kadar üçer ay aralıklar ile ve 24 ay, 30 ay, 36 ay olmak üzere belirlenmiştir. 3.2. Örneklemin Özellikleri DSÖ tarafından bir bebeğin doğum ağırlığının 2500 gramın altında olması doğum ağırlığına bağlı olarak bebekte ölüm riskini artırdığından, düşük doğum ağırlığı olarak tanımlanmaktadır (45). 42 Çocuklarda doğum ağırlığı ve büyümeyi etkileyecek faktörler düşünüldüğünde; normal bir doğum ağırlığı ve büyüme hızı için annenin gebelik esnasında beslenme önerilerine uyması, sigara içmemesi, ciddi bir hastalık durumunun olmaması, tek doğan bebek olması, bebekte herhangi bir kronik hastalığın bulunmaması ve gebelik yaşında 37. haftanın tamamlanmış olması beklenmektedir (46). Belirtilen tüm kriterler göz önünde bulundurulduğunda, bu çalışmada çocukların dahil olma kriterleri olarak gebelik yaşını tamamlamış 2500 gram ve üzerindeki tek doğan çocuklar çalışmaya alınmış olup genetik ya da kronik hastalığı olan çocuklar çalışma dışı bırakılmıştır. 3.3. GAMLSS Model Seçimi Model seçiminde, her etkili serbestlik derecesi için sabit bir ceza katsayısı eklenerek en küçük değeri veren Genelleştirilmiş Akaike Bilgi Kriteri (Generalized Akaike Information Criterion – GAIC) kullanılır. Ceza katsayısı # sembolü ile ifade edilmektedir. GAIC, Akaike Bilgi Kriteri (Akaike Information Criterion – AIC) ve Schwartz Bayes / Bilgi Kriterinin (Schwartz Bayesian Criterion – SBC) genelleştirişmiş hali olup ceza katsayılarının #=3 olması GAIC değerini, #=2 olması AIC değerini ve #=log(n) olması SBC değerine karşılık gelmektedir (46). Uygun dağılımın seçimi uydurma (fitting) ve teşhis aşamaları olmak üzere iki aşamada gerçekleştirilir. Uydurulan modellerin karşılaştırılmalarında GAIC ölçütü kullanılmaktadır ve en küçük GAIC değerine sahip model seçilmektedir. Eşitlik 3.1’de GAIC tanımlanmıştır. 𝐺𝐴𝐼𝐶(#) = −2 ℓ̂ + # 𝑑𝑓 (3.1.) Bu modelde ℓ log-olasılık fonksiyonu olup −2 ℓ̂ küresel sapma değerini (global deviance) değerini vermektedir. (#) sembolü ceza katsayısını, df değeri ise toplam etkili serbestlik derecesini vermektedir. Uydurulan modellerin farklı ceza katsayılarında karşılaştırması yapılmaktadır. 43 Dağılımın seçilmesinde teşhis aşamasında worm grafiklerinden yararlanılmaktadır. Worm grafikleri, bağımsız değişkenin belirli bir aralığı ya da tamamı için model yetersizliğinin belirlenmesinde yardımcı araçtır (33). 3.4. Gerçek Veride Model Seçimi LMS, LMSP ve LMST dağılım parametrelerini tahmin etmek için maksimum cezalı olabilirlik yöntemi kullanılmıştır. Eğrilerde düzleştirme fonksiyonu olarak kübik splinelar kullanılmıştır. Bu üç dağılım için model performanslarını değerlendirmede GAIC değerleri kullanılmış olup bu nedenle ceza katsayısı #=3 olarak belirlenmiştir. Büyüme eğrilerini oluştururken her bir antropometrik ölçümün (μ, σ, ν, τ) dört parametresi için dağılımın en iyi etkili serbestlik dereceleri belirlenmeden önce yaşa uygulanan kuvvet dönüşümü (𝑥 = 𝑦𝑎ş𝜆) değeri belirlenmiştir. Yaş dönüşümü için λ kuvvet değerinin seçiminde ızgara yaklaşımı (grid search) kullanılmıştır. Izgara yaklaşımında, yaş üzerinde λ değeri 0.05’ten başlayarak 0.05’er adımlarla etkili serbestlik derecelerini sabit tutarak en küçük küresel sapma (global deviance) değeri belirlenmiştir. Yaş dönüşümünde en iyi λ değeri belirlendikten sonra, model parametreleri için etkili serbestlik derecelerinin hesaplanmasına geçilmiştir. Model seçiminin başlangıcında, modeldeki tüm parametreler için (μ, σ, ν, τ) 1 etkili serbestlik derecesiyle başlanmıştır. Model parametrelerinin belirlenmesinde; 𝑠𝑑𝜇 için [5-15] aralığındaki, 𝑠𝑑𝜎 için [2-10] aralığındaki, 𝑠𝑑𝜈 için [0-9] aralığındaki ve 𝑠𝑑𝜏 için [0-4] aralığındaki tüm kombinasyonları denenmiş ve en küçük GAIC (#=3) değerini veren model seçilmiştir. Buradaki notasyonda gösterilen "𝑠𝑑" serbestlik derecesi (degrees of freedom) değerini ifade etmektedir. Tüm bu kombinasyonların denemesi tek tek yapıldığı gibi, GAMLSS paketinde otomatik prosedür yardımıyla find.hyper() komutu ile model parametrelerinin seçimi gerçekleştirilmektedir. 3.5. Model Yeterliğinin İncelenmesi GAMLSS yöntemi sonucunda uydurulan modelin yeterliğini incelerken dikkat edilecek noktalardan birincisi; normalleştirilmiş nicel artıkların dağılımının, 44 bağımlı değişkenin dağılımı ne olursa olsun, normal bir dağılım göstermesidir. Bir diğer yöntem ise worm grafiği yardımıyla artıkların dağılımının standart normal bir dağılımdan sapmaları incelenmektedir. Modelin yet