Basit öğe kaydını göster

dc.contributor.advisorGenç, Burkay
dc.contributor.authorKaraşlar, Muazzez Şule
dc.date.accessioned2023-07-03T09:06:39Z
dc.date.issued2022
dc.date.submitted2022
dc.identifier.urihttps://hdl.handle.net/11655/33522
dc.description.abstractWith the developing technology and increasing use of the internet, many sources of data have been exposed to researchers. Analysis and extraction of meaningful information from this data is a research topic under the field of natural language processing. Sentiment analysis which is a sub-field of NLP evaluates the content of data with respect to the opinion it conveys as one of positive or negative. Most sentiment analysis research is done using one of two approaches: lexicon based and machine learning based. Lexicon based approach needs a dictionary of positive and negative words which are used to evaluate a text. Although there are abundance of studies in English, the same can not be claimed for Turkish. Therefore, in our study, we focus on constructing a comprehensive and accurate Turkish sentiment lexicon. In this paper, we aim to develop a Turkish sentiment lexicon with a novel methodology: using statistical tone density functions computed using a very large document corpus obtained from mainstream Turkish news agencies. In this way, for the first time in the literature, a Turkish sentiment lexicon is created by using this method. The lexicon not only assigns tone values instead of boolean polarities, but also provides sharper tones which is usually not possible with other approaches in the literature. We evaluate the performance of this lexicon in comparison with similar lexicons in the literature. Results show that the constructed sentiment lexicon in this study achieves a comparable performance and poses many potential improvement possibilities.tr_TR
dc.language.isoentr_TR
dc.publisherFen Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccesstr_TR
dc.subjectSentiment analysistr_TR
dc.subjectNatural language processing
dc.subjectLexicon
dc.subjectPolarity
dc.subjectStatistical distribution
dc.titleDeveloping A Turkish Sentiment Lexicon Using Tone Distributionstr_TR
dc.typeinfo:eu-repo/semantics/masterThesistr_TR
dc.description.ozetGelişen teknoloji ve internet kullanımının artmasıyla birlikte birçok veri kaynağı araştırmacıların kullanımına açılmıştır. Bu verilerden anlamlı bilgilerin çıkarılması ve analiz edilmesi Doğal Dil İşleme (DDİ) alanında bir araştırma konusudur. DDİ'nin bir alt alanı olan duygu analizi, verilerin içeriğini, verdiği görüşe göre olumlu veya olumsuz olarak değerlendirir. Çoğu duygu analizi araştırması, iki yaklaşımdan biri kullanılarak yapılır: sözlük tabanlı ve makine öğrenimi tabanlı. Sözlük tabanlı yaklaşım, daha sonra bir metni değerlendirmek için kullanılan olumlu ve olumsuz kelimelerden oluşan bir sözlüğe ihtiyaç duyar. İngilizce'de çok sayıda çalışma olmasına rağmen Türkçe için aynı şeyi söylemek pek de mümkün değildir. Bu nedenle, bu çalışmada kapsamlı ve doğru bir Türkçe duygu sözlüğü oluşturmak amaçlanmıştır. Bu çalışma kapsamında, ana akım Türk haber ajanslarından elde edilen kapsamlı bir döküman bütünü kullanılarak ve hesaplanan istatistiksel ton yoğunluğu fonksiyonunu kullanarak yeni bir metodolojiyle Türkçe duygu sözlüğü geliştirmeyi amaçlıyoruz. Bu sayede literatürde ilk kez bu yöntem kullanılarak Türkçe duygu sözlüğü geliştirilmiştir. Bu sözlük, kelimelere yalnızca ikili polariteler yerine ton değerleri atamakla kalmaz, aynı zamanda literatürdeki diğer yaklaşımlarla genellikle mümkün olmayan daha keskin ton değerleri elde edilmesini sağlar. Bu çalışmada, elde ettiğimiz sözlüğün performansını literatürdeki benzer sözlüklerle karşılaştırmalı olarak değerlendiriyoruz. Sonuçlar oluşturulan duygu sözlüğünün karşılaştırılabilir bir performansa ulaştığını ve birçok potansiyel iyileştirme olanağı sunduğunu göstermektedir.tr_TR
dc.contributor.departmentBilgisayar Mühendisliğitr_TR
dc.embargo.termsAcik erisimtr_TR
dc.embargo.lift2023-07-03T09:06:39Z
dc.fundingYoktr_TR


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster