dc.contributor.advisor | Kılınç, Gülşah Merve | |
dc.contributor.author | Çubukcu, Hande | |
dc.date.accessioned | 2024-08-27T11:15:37Z | |
dc.date.issued | 2024-06-14 | |
dc.date.submitted | 2024-07-15 | |
dc.identifier.citation | Cubukcu, H., Evaluation of Genotype Imputation on Ancient Anatolian Human
Genomes, Hacettepe University Graduate School of Health Sciences
Department of Bioinformatics Master’s Thesis, Ankara 2024 | tr_TR |
dc.identifier.uri | https://hdl.handle.net/11655/35647 | |
dc.description.abstract | Genotype
imputation presents a solution to the high amount of missing information in low
coverage ancient DNA samples. In this thesis, by using the phasing and imputation
tool GLIMPSE, the accuracy of genotype imputation and the amount of missing
variants on autosomal biallelic SNPs are evaluated using different genotype posterior
probability filters at four different coverages using ten high coverage and over a
hundred low coverage genomes from Anatolia and West Eurasia. The effect of using
imputed data in frequently used population genetics analyses is investigated. The
accuracy of imputation measured as genotype concordance with high coverage data
reaches 70% to 90% in common variants at 0.1x genome coverage while losing less
than 5% to 15% of all variants using filters between 80% and 99%. Missing amount
in common variants using the same data reaches %20 and %50 in commonly used
Human Origins dataset positions. Pseudohaploid data have more affinity towards the
reference genome compared to the imputed data, pointing to mitigation of reference
bias by imputation. On the other hand, imputed data show tendency towards the
reference panel populations as the coverage decreases. Allele frequency calculations
using imputation and alignment data show up to 15% difference in low coverage
Anatolian Neolithic samples. Results show that it is possible to get reliable results
using imputed data for common variants for low coverage ancient genome samples
from the region of interest | tr_TR |
dc.language.iso | tur | tr_TR |
dc.publisher | Sağlık Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | Antik DNA | tr_TR |
dc.subject | Genotip impütasyonu | tr_TR |
dc.subject | lc-WGS | tr_TR |
dc.subject | Referans yanlılığı | tr_TR |
dc.subject.lcsh | A - Genel konular | tr_TR |
dc.title | Genotip İmpütasyonunun Antik Anadolu İnsan Genomlarında Değerlendirilmesi | tr_TR |
dc.title.alternative | Evaluation of Genotype Imputation on Ancient Anatolian Human Genomes | tr_TR |
dc.type | info:eu-repo/semantics/masterThesis | tr_TR |
dc.description.ozet | Genotip impütasyonu düşük derinlikli antik DNA verilerinde yüksek miktardaki eksik bilgiye bir çözüm sunmaktadır. Bu tezde, fazlama ve impütasyon metodu GLIMPSE kullanarak, otozomal biallelik TNP’lerde impütasyonun doğruluğu ve kayıp miktarları, Anadolu ve Batı Avrasya’dan on yüksek derinlikli ve yüzün üzerinde düşük derinlikli örnek ile dört farklı genom derinliğinde farklı filtreler kullanılarak değerlendirilmiştir. İmpütasyon verisini sıklıkla kullanılan popülasyon genetiği analizlerinde kullanmanın etkisi araştırılmıştır. Yüksek kaliteli veri ile genotip uyumluluğu olarak ölçülen impütasyon doğruluğu, 0.1x derinliğinde yaygın varyantlarda %80 ve %99 genotip olasılığı filtreleri ile sırasıyla %70’e ve %90’a ulaşırken tüm varyantların %5’ten ve %15’ten azı kaybedilmektedir. Yaygın kullanılan Human Origins veriseti pozisyonlarında 0.1x verisi için yaygın varyantlarda kayıp oranları aynı filtreler ile %20 ve %50’ye ulaşmaktadır. Temel bileşenler analizi ve f4 istatistiklerine göre sözde-haploid veride daha fazla referans yanlılığı görülmektedir, bu da impütasyonun referans yanlılığını azalttığına işaret etmektedir. Diğer yandan, impütasyon verisinde genom derinliği düştükçe referans panel popülasyonlarına eğilim görülmektedir. Alel frekans hesabı karşılaştırmalarına göre, Anadolu Neolitik dönem örneklerinde impütasyon veya hizalama verisinden hesaplanan sıklık değerleri arasında yaygın varyantlarda yüzde 15’e kadar fark görülebilmektedir. Elde edilen sonuçlara göre, ilgi alanı bölgeden düşük derinlikli antik genom örneklerinde impütasyon kullanarak yaygın varyantlar için güvenilir sonuçlar almak mümkündür. | tr_TR |
dc.contributor.department | Biyoinformatik | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | 2024-08-27T11:15:37Z | |
dc.funding | TÜBİTAK | tr_TR |