dc.contributor.advisor | Genç, Burkay | |
dc.contributor.author | Karaşlar, Muazzez Şule | |
dc.date.accessioned | 2023-07-03T09:06:39Z | |
dc.date.issued | 2022 | |
dc.date.submitted | 2022 | |
dc.identifier.uri | https://hdl.handle.net/11655/33522 | |
dc.description.abstract | With the developing technology and increasing use of the internet, many sources of data have been exposed to researchers. Analysis and extraction of meaningful information from this data is a research topic under the field of natural language processing. Sentiment analysis which is a sub-field of NLP evaluates the content of data with respect to the opinion it conveys as one of positive or negative. Most sentiment analysis research is done using one of two approaches: lexicon based and machine learning based. Lexicon based approach needs a dictionary of positive and negative words which are used to evaluate a text. Although there are abundance of studies in English, the same can not be claimed for Turkish. Therefore, in our study, we focus on constructing a comprehensive and accurate Turkish sentiment lexicon.
In this paper, we aim to develop a Turkish sentiment lexicon with a novel methodology: using statistical tone density functions computed using a very large document corpus obtained from mainstream Turkish news agencies. In this way, for the first time in the literature, a Turkish sentiment lexicon is created by using this method. The lexicon not only assigns tone values instead of boolean polarities, but also provides sharper tones which is usually not possible with other approaches in the literature. We evaluate the performance of this lexicon in comparison with similar lexicons in the literature. Results show that the constructed sentiment lexicon in this study achieves a comparable performance and poses many potential improvement possibilities. | tr_TR |
dc.language.iso | en | tr_TR |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | Sentiment analysis | tr_TR |
dc.subject | Natural language processing | |
dc.subject | Lexicon | |
dc.subject | Polarity | |
dc.subject | Statistical distribution | |
dc.title | Developing A Turkish Sentiment Lexicon Using Tone Distributions | tr_TR |
dc.type | info:eu-repo/semantics/masterThesis | tr_TR |
dc.description.ozet | Gelişen teknoloji ve internet kullanımının artmasıyla birlikte birçok veri kaynağı araştırmacıların kullanımına açılmıştır. Bu verilerden anlamlı bilgilerin çıkarılması ve analiz edilmesi Doğal Dil İşleme (DDİ) alanında bir araştırma konusudur. DDİ'nin bir alt alanı olan duygu analizi, verilerin içeriğini, verdiği görüşe göre olumlu veya olumsuz olarak değerlendirir. Çoğu duygu analizi araştırması, iki yaklaşımdan biri kullanılarak yapılır: sözlük tabanlı ve makine öğrenimi tabanlı. Sözlük tabanlı yaklaşım, daha sonra bir metni değerlendirmek için kullanılan olumlu ve olumsuz kelimelerden oluşan bir sözlüğe ihtiyaç duyar. İngilizce'de çok sayıda çalışma olmasına rağmen Türkçe için aynı şeyi söylemek pek de mümkün değildir. Bu nedenle, bu çalışmada kapsamlı ve doğru bir Türkçe duygu sözlüğü oluşturmak amaçlanmıştır.
Bu çalışma kapsamında, ana akım Türk haber ajanslarından elde edilen kapsamlı bir döküman bütünü kullanılarak ve hesaplanan istatistiksel ton yoğunluğu fonksiyonunu kullanarak yeni bir metodolojiyle Türkçe duygu sözlüğü geliştirmeyi amaçlıyoruz. Bu sayede literatürde ilk kez bu yöntem kullanılarak Türkçe duygu sözlüğü geliştirilmiştir. Bu sözlük, kelimelere yalnızca ikili polariteler yerine ton değerleri atamakla kalmaz, aynı zamanda literatürdeki diğer yaklaşımlarla genellikle mümkün olmayan daha keskin ton değerleri elde edilmesini sağlar. Bu çalışmada, elde ettiğimiz sözlüğün performansını literatürdeki benzer sözlüklerle karşılaştırmalı olarak değerlendiriyoruz. Sonuçlar oluşturulan duygu sözlüğünün karşılaştırılabilir bir performansa ulaştığını ve birçok potansiyel iyileştirme olanağı sunduğunu göstermektedir. | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | 2023-07-03T09:06:39Z | |
dc.funding | Yok | tr_TR |