dc.contributor.advisor | Erdem, Mehmet Erkut | |
dc.contributor.author | Çizmeciler, Kemal | |
dc.date.accessioned | 2022-10-20T08:08:10Z | |
dc.date.issued | 2022 | |
dc.date.submitted | 2022-06-22 | |
dc.identifier.citation | Cizmeciler, Kemal, Erkut Erdem, and Aykut Erdem. "Leveraging semantic saliency maps for query-specific video summarization." Multimedia Tools and Applications 81.12 (2022): 17457-17482. | tr_TR |
dc.identifier.uri | http://hdl.handle.net/11655/26966 | |
dc.description.abstract | Automatic video summarization is a technique that allows us to easily understand and analyze large amount of visual data. Methods in the literature do this by dividing the video into certain parts and assigning a significance value to these parts. In query-based summary extraction, how query terms can be included in the importance value has been investigated.
In this study, it was investigated which criteria could be effective in assigning importance value in query-based summarization, and it is suggested that semantic attributes and visual salience maps could contribute. In addition, these concepts are also included in the query terms, since the query terms may be the place where the activity is carried out or the actor performing the activity, rather than just some activities. In the experiments, it has been observed that the inclusion of semantic and visual saliency maps in the diversity term, which is one of the 3 functions included in the optimization, makes a positive contribution. Two other functions considered in optimization are representation and query term relevance. In short, with the thought that the places people look at the video may change when they view the video within a certain task (Task-Oriented Attention), it is useful to predetermine the relevant parts in the video and to give extra weight to these sections in the summaries. Detailed experiments and visual results on two large datasets have demonstrated the correctness of the proposed hypothesis. | tr_TR |
dc.language.iso | en | tr_TR |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | Yapay zeka | tr_TR |
dc.subject | Derin öğrenme | tr_TR |
dc.subject | Sorgu tabanlı video ̈ozetleme | tr_TR |
dc.subject | Görsel belirginlik | tr_TR |
dc.title | Leveragıng Semantıc Salıency Maps For
Query-Specıfıc Vıdeo Summarızatıon | tr_en |
dc.title.alternative | Sorguya Özel Video Özetleme İçin Anlamsal
Belirginlik Haritalarından Yararlanma | tr_tr |
dc.type | info:eu-repo/semantics/doctoralThesis | tr_TR |
dc.description.ozet | Otomatik video özetleme, büyük miktarda görsel veriyi kolayca anlamamıza ve analiz etmemize yarayan bir tekniktir. Literatürdeki metotlar bunu videyu belli parçalara ayırarak ve bu parçalara bir önem değeri atayarak gerçekleştirirler. Sorgu tabanlı özet çıkarmada ise sorgu terimlerinin nasıl önem değerine dahil edilebileceği araştırılmıştır.
Bu çalışmada sorgu tabanlı özetlemede önem değeri atarken hangi kriterlerin etkili olabileceği araştırılmıştır ve anlamsal öznitelikler ve görsel belirginlik haritalarının katkı sağlayabileceği öne sürülmüştür. Ayrıca sorgu terimlerinin sadece bazı aktiviteler olmaktan ziyade, aktivitenin gerçekleştirildiği mekan veya aktiviteyi gerçekleştiren aktör olabileceği için bu kavramlar da sorgu terimlerine dahil edilmiştir. Yapılan deneylerde, optimizasyona dahil edilen 3 fonksiyondan biri olan kapsama terimine anlamsal ve görsel belirginlik haritalarının dahil edilmesinin olumlu katkı sağladığı gözlemlenmiştir. Optimizasyonda dikkate alınan diğer iki fonksiyon ise temsil ve sorgu terimi yakınlığıdır. Kısaca, insanların belli bir görev dahilinde videoyu incelediğinde baktığı yerlerin değişebileceği düşüncesiyle (Görev Odaklı Dikkat), videodaki ilgili yerlerin önceden belirlenmesi ve çıkarılan özetlerde bu bölümlere ağırlık verilmesi faydalı olmuştur. İki büyük veri kümesi üzerinde yapılan ayrıntılı deneyler ve görsel sonuçlar, öne sürülen hipotezin doğruluğunu gözler önüne sermiştir. | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |
dc.embargo.terms | Acik erisim | tr_TR |
dc.embargo.lift | 2022-10-20T08:08:10Z | |
dc.funding | Yok | tr_TR |
dc.subtype | dataset | tr_TR |