dc.contributor.advisor | Sever, Hayri | tr_TR |
dc.contributor.author | Ahamdlouei, Hamid | tr_TR |
dc.date.accessioned | 2015-10-15T08:42:08Z | |
dc.date.available | 2015-10-15T08:42:08Z | |
dc.date.issued | 2015 | tr_TR |
dc.identifier.uri | http://hdl.handle.net/11655/2598 | |
dc.description.abstract | This thesis aims to test the performance of the Story Link Detection (SLD) task aspart of the Topic Detection and Tracking (TDT) program using different similarityfunctions and test their combinations performance on named entities, and find theone that provides the optimum precision recall values. To do this, we used theVector Space Model (VSM) as the main method which their performance is provenin TDT studies, and evaluate the impact of Named Entities on the VSM performance.In order to test the performance of methods, we used the BilCOL-2005 corpus aftertagged named entites which were used to respond to who, where, when and etcquestions with eight (who, where, when, organization, Money, percentage, date,unknown) different labels. | tr_TR |
dc.language.iso | tur | tr_TR |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.subject | topic detection and tracking | tr_TR |
dc.title | Türkçe Haber Benzerliklerinin Belirlenmesinde Varlık İsimlerinin Hikaye Bağlantı Algılama Görevinin Başarımına Etkisi | tr_TR |
dc.type | info:eu-repo/semantics/masterThesis | tr_TR |
dc.callno | 2015/1725 | tr_TR |
dc.contributor.departmentold | Bilgisayar Mühendisliği | tr_TR |
dc.description.ozet | Tez, Konu Tespit ve Takip (Topic Detection and Tracking - TDT) programındatanımlı Hikaye Bağlantı Algılama (Story Link Detection - SLD) görevinin Türkçe birderlem üzerinde farklı benzerlik fonksiyonları ve bunların kombinasyonlarını Varlıkİsimler üzerinde kullanılarak başarımının test edilmesini ve anma duyarlık uygundeğerlerini sağlayacak kombinasyonun bulunmasını amaçlamaktadır. Bukapsamda, TDT içerisinde başarısı kanıtlanmış olan Vektör Uzayı Modeli (VectorSpace Model) temel yöntem olarak kabul edildi ve bu yöntemle birlikte Varlıkİsimlerinin (Named Entity) kullanılmasının başarım üzerindeki etkileri değerlendirildi.Tezde tanımlanan yöntemlerin test edilebilmesi için BilCOL-2005 derlemihaberlerde kim, nerede, ne zaman vs. gibi sorularına yanıt verecek varlık isimlerinsekiz farklı (kişi, konum, zaman, kurum, para, yüzde ve belirsiz) etiketlerleişaretlenerek kullanıldı. | tr_TR |