dc.contributor.advisor | Can Buğlalılar , Burcu | |
dc.contributor.author | Eşref, Yasin | |
dc.date.accessioned | 2019-10-21T12:34:03Z | |
dc.date.issued | 2019 | |
dc.date.submitted | 2019-06-18 | |
dc.identifier.uri | http://hdl.handle.net/11655/9391 | |
dc.description.abstract | Because of the inflection of many word forms from the same root in agglutinative languages such as Turkish, modeling the words as a whole causes sparsity problem. Therefore, rather than handling the word as a whole, expressing a word through its characters or considering the morpheme and morpheme label information gives more detailed information about the word and therefore mitigates the sparsity problem.
In this study, a model using deep neural networks is proposed for the sequence labeling task in Turkish. To cope with the sparsity problem, character and morpheme information is used and the effect of this information on sequence labeling problem is examined. The existing deep learning models are applied using different word or sub-word representations for Named Entity Recognition (NER) and Part-of-Speech Tagging (POS Tagging) in Turkish. The results show that using morpheme information improves the sequence labelling in Turkish. Moreover, more accurate results are obtained by using the contextual information in the model. | tr_TR |
dc.description.tableofcontents | ÖZET
ABSTRACT
TEŞEKKÜR
İÇİNDEKİLER
ÇİZELGELER
ŞEKİLLER
KISALTMALAR
1. GİRİŞ
1.1. Dizi Etiketleme Problemleri
1.1.1. Varlık İsmi Tanıma
1.1.2. Sözcük Türü İşaretleme
1.2. Motivasyon
1.3. Araştırma Soruları
1.4. Tezin Yapısı
2. ALAN BİLGİSİ
2.1. Kelime Vektörleri
2.1.1. Word2Vec
2.1.2. Diğer Kelime Vektörü Yaklaşımları
2.2. Tekrarlayan Sinir Ağları
2.2.1. Tanım
2.2.2. Çift yönlü RNN
2.2.3. Uzun Kısa Süreli Bellek Ağları
2.2.4. Diziden Diziye Modeli
2.3. Evrişimli Sinir Ağları
2.4. Dikkat Mekanizması
2.4.1. Tanım
2.4.2. Basitleştirilmiş Dikkat Ağları
2.4.3. Öz Dikkat Modeli
2.5. Koşullu Rastgele Alan
2.5.1. Tanım
3. LİTERATÜR İNCELEMESİ
3.1. Dizi Etiketleme Alanındaki Güncel Yöntemler
3.2. Dikkat Mekanizması Kullanan Çalışmalar
3.3. Türkçede Dizi Etiketleme Çalışmaları
4. ÖNERİLEN MODEL
4.1. Model Girdileri
4.1.1. Kelime Vektörleri
4.1.2. Karakter Vektörleri
4.1.3. Morfem Vektörleri
4.2. LSTM-CRF Modeli
4.2.1. Öz Dikkat Ağı
4.3. Geliştirme Detayları
5. DENEYLER & SONUÇLAR
5.1. Veri Kümeleri
5.2. Deneyler
5.2.1. Deney Parametreleri ve Eğitim
5.2.2. Değerlendirme
5.2.3. Deney Sonuçları
6. SONUÇ
6.1. Sonuç
6.2. Gelecek Çalışmalar | tr_TR |
dc.language.iso | tur | tr_TR |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | Doğal dil İşleme | tr_TR |
dc.subject | Dizi etiketleme | tr_TR |
dc.subject | Varlık ismi tanıma | tr_TR |
dc.subject | Derin öğrenme | tr_TR |
dc.subject | Dikkat ağları | tr_TR |
dc.subject | Sözcük türü işaretleme | tr_TR |
dc.subject.lcsh | Konu Başlıkları Listesi::Teknoloji. Mühendislik::Bilgisayar mühendisliği | tr_TR |
dc.title | Türkçe Dizi Etiketleme İçin Sinir Ağ Modelleri | tr_TR |
dc.title.alternative | Neural Models For Turkısh Sequence
Labelıng | |
dc.type | info:eu-repo/semantics/masterThesis | tr_TR |
dc.description.ozet | Türkçe gibi sondan eklemeli dillerde aynı kökten birçok kelimenin türetilmesinden dolayı kelimelerin bir bütün olarak modellenmesi seyreklik problemini de beraberinde getirmektedir. Bundan ötürü, kelimeyi bir bütün olarak ele almaktansa karakterleri üzerinden bir kelimeyi ifade etmek ya da morfem ve morfemin etiket bilgisini hesaba katmak kelime hakkında daha detaylı bilgi vermekte ve seyreklik problemini de azaltmaktadır.
Bu çalışmada Türkçede kelime dizilerini etiketleme problemleri için derin sinir ağlarını kullanan bir model önerilmiştir. Seyreklik problemini çözmek için kelimelerin karakter ve morfem bilgilerin dizi etiketleme problemi kapsamındaki etkisi incelenmiştir.
Bu çalışmada literatürdeki güncel derin öğrenme modelleri Türkçe için farklı kelime veya alt-kelime düzeyinde gösterimler kullanılarak Varlık İsmi Tanıma ve Sözcük Türü İşaretleme problemleri için uygulanmıştır. Sonuçlar, kelimelerin morfem bilgisinin kullanılmasının Türkçede dizi etiketlemeyi iyileştirdiğini göstermektedir. Ayrıca kelime dizilerinin etiketlerini bulurken komşu kelimelerin bilgilerinden de yararlanılarak doğruluğu daha yüksek sonuçlar elde edilmiştir. | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | - | |
dc.subject.ieee | IEEE Thesaurus Terms::Systems, man, and cybernetics::Natural language processing | tr_TR |
dc.subject.ieee | IEEE Thesaurus Terms::Computational and artificial intelligence::Deep learning | tr_TR |