Basit öğe kaydını göster

dc.contributor.advisorKılınç, Gülşah Merve
dc.contributor.authorÇubukcu, Hande
dc.date.accessioned2024-08-27T11:15:37Z
dc.date.issued2024-06-14
dc.date.submitted2024-07-15
dc.identifier.citationCubukcu, H., Evaluation of Genotype Imputation on Ancient Anatolian Human Genomes, Hacettepe University Graduate School of Health Sciences Department of Bioinformatics Master’s Thesis, Ankara 2024tr_TR
dc.identifier.urihttps://hdl.handle.net/11655/35647
dc.description.abstractGenotype imputation presents a solution to the high amount of missing information in low coverage ancient DNA samples. In this thesis, by using the phasing and imputation tool GLIMPSE, the accuracy of genotype imputation and the amount of missing variants on autosomal biallelic SNPs are evaluated using different genotype posterior probability filters at four different coverages using ten high coverage and over a hundred low coverage genomes from Anatolia and West Eurasia. The effect of using imputed data in frequently used population genetics analyses is investigated. The accuracy of imputation measured as genotype concordance with high coverage data reaches 70% to 90% in common variants at 0.1x genome coverage while losing less than 5% to 15% of all variants using filters between 80% and 99%. Missing amount in common variants using the same data reaches %20 and %50 in commonly used Human Origins dataset positions. Pseudohaploid data have more affinity towards the reference genome compared to the imputed data, pointing to mitigation of reference bias by imputation. On the other hand, imputed data show tendency towards the reference panel populations as the coverage decreases. Allele frequency calculations using imputation and alignment data show up to 15% difference in low coverage Anatolian Neolithic samples. Results show that it is possible to get reliable results using imputed data for common variants for low coverage ancient genome samples from the region of interesttr_TR
dc.language.isoturtr_TR
dc.publisherSağlık Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccesstr_TR
dc.subjectAntik DNAtr_TR
dc.subjectGenotip impütasyonutr_TR
dc.subjectlc-WGStr_TR
dc.subjectReferans yanlılığıtr_TR
dc.subject.lcshA - Genel konulartr_TR
dc.titleGenotip İmpütasyonunun Antik Anadolu İnsan Genomlarında Değerlendirilmesitr_TR
dc.title.alternativeEvaluation of Genotype Imputation on Ancient Anatolian Human Genomestr_TR
dc.typeinfo:eu-repo/semantics/masterThesistr_TR
dc.description.ozetGenotip impütasyonu düşük derinlikli antik DNA verilerinde yüksek miktardaki eksik bilgiye bir çözüm sunmaktadır. Bu tezde, fazlama ve impütasyon metodu GLIMPSE kullanarak, otozomal biallelik TNP’lerde impütasyonun doğruluğu ve kayıp miktarları, Anadolu ve Batı Avrasya’dan on yüksek derinlikli ve yüzün üzerinde düşük derinlikli örnek ile dört farklı genom derinliğinde farklı filtreler kullanılarak değerlendirilmiştir. İmpütasyon verisini sıklıkla kullanılan popülasyon genetiği analizlerinde kullanmanın etkisi araştırılmıştır. Yüksek kaliteli veri ile genotip uyumluluğu olarak ölçülen impütasyon doğruluğu, 0.1x derinliğinde yaygın varyantlarda %80 ve %99 genotip olasılığı filtreleri ile sırasıyla %70’e ve %90’a ulaşırken tüm varyantların %5’ten ve %15’ten azı kaybedilmektedir. Yaygın kullanılan Human Origins veriseti pozisyonlarında 0.1x verisi için yaygın varyantlarda kayıp oranları aynı filtreler ile %20 ve %50’ye ulaşmaktadır. Temel bileşenler analizi ve f4 istatistiklerine göre sözde-haploid veride daha fazla referans yanlılığı görülmektedir, bu da impütasyonun referans yanlılığını azalttığına işaret etmektedir. Diğer yandan, impütasyon verisinde genom derinliği düştükçe referans panel popülasyonlarına eğilim görülmektedir. Alel frekans hesabı karşılaştırmalarına göre, Anadolu Neolitik dönem örneklerinde impütasyon veya hizalama verisinden hesaplanan sıklık değerleri arasında yaygın varyantlarda yüzde 15’e kadar fark görülebilmektedir. Elde edilen sonuçlara göre, ilgi alanı bölgeden düşük derinlikli antik genom örneklerinde impütasyon kullanarak yaygın varyantlar için güvenilir sonuçlar almak mümkündür.tr_TR
dc.contributor.departmentBiyoinformatiktr_TR
dc.embargo.termsAcik erisimtr_TR
dc.embargo.lift2024-08-27T11:15:37Z
dc.fundingTÜBİTAKtr_TR


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster