Basit öğe kaydını göster

dc.contributor.advisorSezer, Ebru
dc.contributor.authorCanbay, Pelin
dc.date.accessioned2020-09-17T10:42:49Z
dc.date.issued2020
dc.date.submitted2020-07
dc.identifier.urihttp://hdl.handle.net/11655/22756
dc.description.abstractAuthorship verification is a decision problem that tries to find out whether the text of an unknown author belongs to a suspicious author. The problem is the fundamental one of the studies in authorship analysis that has been interested in many years. The challenges of the authorship verification problems have arisen from the small number of known documents of the suspicious author. In the literature, author-dependent style comparison has generally presented as a solution to the authorship verification problem, which is a current and interesting subject. However, as the amount of known text of the suspicious author decreases, it becomes harder to extract accurate style. In this thesis, studies have been carried out on how authorship verification should be done even when the amount of known texts from the suspicious author is very low. Within the scope of this thesis, a binary background assisted author-independent system is proposed for the solution of the situation we handled. The proposed system has more generalization ability than the current solutions. Besides, the proposed system is language independent. The system, in which different languages can be easily integrated, has been tested within the scope of the thesis with Turkish and English languages, and the most accurate authorship verification result has been obtained in a public English dataset used in the field of authorship analysis. In this thesis, also, a Turkish Blog dataset has been collected and shared with the researchers in order to increase the Turkish-based authorship analysis studies. The proposed system, which also produced successful results when using the Turkish Blog dataset, has produced results that will be useful even in determining the high discriminative features with the priority of the Turkish language.tr_TR
dc.language.isoturtr_TR
dc.publisherFen Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccesstr_TR
dc.subjectYazar doğrulamatr_TR
dc.subjectMetin-doküman analizitr_TR
dc.subjectTürkçe Blog veri kümesitr_TR
dc.subjectYazar analizitr_TR
dc.subjectMakine öğrenmesitr_TR
dc.subject.lcshBilgisayar mühendisliğitr_TR
dc.titleİkili Arka Plan Destekli Yazar - Bağımsız Yazarlık Doğrulama Sistemitr_TR
dc.title.alternativeBınary Background Assısted Authorındependent Authorshıp Verıfıcatıon Systemtr_en
dc.typeinfo:eu-repo/semantics/doctoralThesistr_TR
dc.description.ozetYazar doğrulama, yazarı bilinmeyen bir metnin şüpheli bir yazara ait olup olmadığını bulmaya çalışan bir karar problemidir. Bu problem, uzun yıllardır ilgi gören yazar analizi çalışmalarının en temel problemlerinden biridir. Yazar doğrulama probleminin zorluğu, şüpheli yazara ait olduğu bilinen doküman sayısının az olmasından kaynaklanmaktadır. Güncel ve ilgi gören bir konu olan yazar doğrulama problemine literatürde genellikle yazar bağımlı üslup karşılaştırması çözüm olarak sunulmuştur. Fakat şüpheli yazara ait olduğu bilinen metin miktarı azaldıkça doğru üslubun çıkarılması da zorlaşmaktadır. Bu tez çalışmasında, şüpheli yazara ait olduğu bilinen metin miktarının çok az olduğu durumda bile yazar doğrulamasının nasıl yapılması gerektiği üzerine çalışmalar yapılmıştır. Tez kapsamında, ele alınan bu durumun çözümü için ikili arka plan destekli yazar –bağımsız bir sistem önerilmiştir. Önerilen sistem mevcut çözümlere göre daha yüksek genelleştirme kabiliyetine sahiptir. Önerilen bu sistem ayrıca dil bağımsız bir sistemdir. Farklı dillerin kolaylıkla entegre edilebildiği bu sistem, tez kapsamında Türkçe ve İngilizce dilleri ile test edilmiş ve yazar analizi alanında kullanılan açık bir İngilizce veri kümesinde şimdiye kadarki en başarılı yazar doğrulama sonucu elde edilmiştir. Tez kapsamında ek olarak bir Türkçe Blog Külliyatı da oluşturulmuş ve bu külliyat Türkçe odaklı yazar analizi çalışmalarının arttırılması amacı ile araştırmacılarla paylaşılmıştır. Türkçe Blog Külliyatı kullanıldığında da başarılı sonuçlar üreten önerilen sistem, Türkçe dili öncelikli, yüksek ayırt ediciliğe sahip özniteliklerin belirlenmesinde de faydalı olacak sonuçlar üretmiştir.tr_TR
dc.contributor.departmentBilgisayar Mühendisliğitr_TR
dc.embargo.termsAcik erisimtr_TR
dc.embargo.lift2020-09-17T10:42:49Z
dc.fundingYoktr_TR


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster