Evaluatıng the Use of Neural Rankıng Methods in Search Engınes

Şahin, Ömer

dc.contributor.advisor	Çiçekli, İlyas
dc.contributor.advisor	Ercan, Gönenç
dc.contributor.author	Şahin, Ömer
dc.date.accessioned	2022-04-01T11:26:57Z
dc.date.issued	2022
dc.date.submitted	2022-01-06
dc.identifier.uri	http://hdl.handle.net/11655/26118
dc.description.abstract	A search engine strikes a balance between effectiveness and efficiency to retrieve the best documents in a scalable way. Recent deep learning-based ranker methods prove effective and improve state of the art in relevancy metrics. However, unlike index-based retrieval methods, neural rankers like BERT do not scale to large datasets. In this thesis, we propose a query term weighting method that can be used with a standard inverted index without modifying it. Using a pairwise ranking loss, query term weights are learned using relevant and irrelevant document pairs for each query. The learned weights prove to be more effective than term recall values previously used for the task. We further show that these weights can be predicted with a BERT regression model and improve the performance of both a BM25 based index and an index already optimized with a term weighting function. In addition, we examine document term weighting methods in the literature that work by manipulating term frequencies or expanding documents for document retrieval tasks. Predicting weights with the help of contextual knowledge about document instead of term frequencies for documents terms significantly increase retrieval and ranking performance.	tr_TR
dc.language.iso	en	tr_TR
dc.publisher	Fen Bilimleri Enstitüsü	tr_TR
dc.rights	info:eu-repo/semantics/openAccess	tr_TR
dc.subject	Information Retrieval	tr_TR
dc.subject	Passage Ranking	tr_TR
dc.subject	Term Weighting	tr_TR
dc.subject	Pairwise Ranking Optimization	tr_TR
dc.title	Evaluatıng the Use of Neural Rankıng Methods in Search Engınes	tr_TR
dc.title.alternative	Sinirsel Sıralama Yöntemlerinin Arama Motorlarında Kullanımının Değerlendirilmesi	tr_TR
dc.type	info:eu-repo/semantics/masterThesis	tr_TR
dc.description.ozet	Bir arama motoru, en alakalı belgeleri ölçeklenebilir bir zamanda alabilmeli, etkinlik ve verimlilik arasında bir denge kurmalıdır. Son zamanlardaki derin öğrenme tabanlı sıralayıcı yöntemlerinin etkili olduğu kanıtlanmıştır ve alaka ölçütlerinde en son teknolojiyi oluşturmaktadır. Ancak, dizin tabanlı alma yöntemlerinin aksine, BERT gibi sinirsel sıralayıcılar büyük veri kümelerine ölçeklenemez. Bu tezde, standart bir ters indekslemeyi değiştirilmeden kullanılabilecek bir sorgu terimi ağırlıklandırma yöntemi öneriyoruz. Sorgu terim ağırlıkları, ikili sıralama kaybı kullanılarak her sorgu için alakalı ve alakasız belge çiftleri kullanılarak eğitilir. Öğrenilen ağırlıkların, bu görev için daha önce kullanılan terim hatırlama değerlerinden daha etkili olduğu kanıtlanmıştır. Ayrıca, bu ağırlıkların bir BERT regresyon modeli ile tahmin edilebileceğini ve hem BM25 tabanlı bir indeksin hem de bir terim ağırlıklandırma fonksiyonu ile halihazırda optimize edilmiş bir indeksin performansını iyileştirdiğini gösteriyoruz. Ek olarak, belge alma görevleri için terim sıklıklarını değiştirerek veya belgeleri genişleterek çalışan literatürdeki belge terimi ağırlıklandırma yöntemlerini inceliyoruz. Belge terimleri için terim frekansları yerine belge hakkındaki bağlamsal bilginin yardımıyla ağırlıkları tahmin etmek, alma ve sıralama performansını önemli ölçüde artırır.	tr_TR
dc.contributor.department	Bilgisayar Mühendisliği	tr_TR
dc.embargo.terms	Acik erisim	tr_TR
dc.embargo.lift	2022-04-01T11:26:57Z
dc.funding	Yok	tr_TR

Bu öğenin dosyaları:

Ad:: OmerSahin_Master_2022-01-17.pdf
Boyut:: 3.369Mb
Biçim:: PDF

Göster/Aç

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Bilgisayar Mühendisliği Bölümü Tez Koleksiyonu [212]

Basit öğe kaydını göster