Basit öğe kaydını göster

dc.contributor.advisorSoydal, Iremtr_TR
dc.contributor.authorŞencan, Ipektr_TR
dc.date.accessioned2015-10-14T12:55:30Z
dc.date.available2015-10-14T12:55:30Z
dc.date.issued2014tr_TR
dc.identifier.urihttp://hdl.handle.net/11655/1216
dc.description.abstractWith text categorization it is possible to access information within a large pile of impure data. It also helps people to save time who wants to have information more easily and practically. One of the most important practical research areas in terms of text categorization is news, as it has a potential of rapid increase. This thesis aims to investigate the connection of subject codes with named entities, in terms of text categorization, by using 5834 news texts which were obtained from BilCol-2005 news corpus. To address this, 5834 news were tagged with seven different named entities (person, organization, location, date, time, money and percentage). Tagged news were classified under 13 different subject codes of IPTC s (International Press Telecommunications Council) main subject taxonomies. The investigation was based on tagged and untagged words and their relations with the IPTC news codes. Key findings were revealed with the frequency and percentage values along with some statitr_TR
dc.language.isoturtr_TR
dc.publisherSosyal Bilimler Enstitüsütr_TR
dc.subjectText categorizationus_US
dc.titleHaber Metinlerinin Kategorizasyonunda Varlık Isimleri ve Konu Başlıkları Ilişkisitr_TR
dc.typeinfo:eu-repo/semantics/masterThesistr_TR
dc.callno2014/1194tr_TR
dc.contributor.departmentoldBilgi ve Belge Yönetimitr_TR
dc.contributor.departmentoldMetin kategorizasyonutr_TR
dc.contributor.departmentoldcategorization of news itemsus_US
dc.contributor.departmentoldhaber metinlerinin kategorizasyonutr_TR
dc.contributor.departmentoldnamed entitiesus_US
dc.contributor.departmentoldvarlık isimleritr_TR
dc.description.ozetMetin kategorizasyonu ile büyük ve kirli veri yığınlarının içerisindeki bilgiler düzenlenerek bilgiye erişim kolay ve pratik hale gelmektedir. Metin kategorizasyonu ayrıca, bilgiye ihtiyaç duyan kişilerin istedikleri bilgiye erişmelerinde zaman kazandırmak açısından da son derece önemlidir. Haber metinleri gibi hızlı artış potansiyeline sahip olan yapılar metin kategorizasyonuna ihtiyaç duyulan önemli uygulama alanlarından biridir. Bu çalışmada, BilCol-2005 Türkçe haber derleminden sağlanan 5834 haber kullanılarak, haber metinlerinin kategorizasyonunda varlık isimleri (named entities) ve konu başlıkları ilişkisinin incelenmesi amaçlanmıştır. Buna yönelik olarak 5834 haber yedi farklı varlık ismi (kişi, kurum, konum, tarih, zaman, para ve yüzde) ile etiketlenmiştir. Etiketlenen haberler IPTC (International Press Telecommunications Council) temel düzey konu başlıkları taksonomisine göre kategorize edilmiş ve derlem 13 farklı IPTC konu başlığı ile tanımlanmıştır. Bu doğrultuda gerçekletr_TR


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster