Unsupervised Video Summarization With
Independently Recurrent Neural Networks
And Multiple Rewards

Yalınız , Gökhan

dc.contributor.advisor	İkizler Cinbiş , Nazlı
dc.contributor.author	Yalınız , Gökhan
dc.date.accessioned	2019-11-26T13:55:37Z
dc.date.issued	2019
dc.date.submitted	2019-09-09
dc.identifier.citation	Yaliniz, G. (2019). Unsupervised Video Summarization with Independently Recurrent Neural Networks and Multiple Rewards (Master's thesis), Hacettepe University, Ankara, TURKEY.	tr_TR
dc.identifier.uri	http://hdl.handle.net/11655/11953
dc.description.abstract	Video summarization, one of the interesting research areas that has significant acceleration in recent years, is producing shorter and concise videos that represent the content of long videos as diversely as possible. It is observed that sigmoid and hyperbolic activation functions used in long short-term memory (LSTM) and gated recurrent unit (GRU) models used in recent studies on video summarization task, may cause gradient decay over layers. Moreover, interpreting and developing network models are hard because of entanglement of neurons on recurrent neural network (RNN). Besides that, to create good video summary from long videos, a model needs to retain temporal coherence. Irrelevant jumps within key segments can confuse a viewer. Therefore, a model should compose video summary uniformly. To solve these issues, in this study, a method that uses deep reinforcement learning together with independently recurrent neural networks (IndRNN) is proposed for unsupervised video summarization. In this method, Leaky Rectified Linear Unit (Leaky ReLU) is used as an activation function to deal with decaying gradient and dying neuron problems. The model, which does not rely on any labels or user interaction, is designed with a reward function that jointly accounts for uniformity, diversity and representativeness of generated summaries. In this way, the model can create summaries as uniform as possible, has more layers and can be trained with more steps without having any problem related to gradients. Based on the experiments conducted on two benchmark datasets, it is observed that, compared to the state-of-the-art methods on video summarization task, better results are obtained.	tr_TR
dc.description.sponsorship	TUBİTAK 116E685	tr_TR
dc.language.iso	en	tr_TR
dc.publisher	Fen Bilimleri Enstitüsü	tr_TR
dc.rights	info:eu-repo/semantics/openAccess	tr_TR
dc.subject	Video summarization	tr_eng
dc.subject	İndependently recurrent neural network	tr_TR
dc.subject	Recurrent neural network	tr_TR
dc.subject	Long short term memory	tr_TR
dc.subject	Uniformity	tr_TR
dc.subject	Unsupervised	tr_TR
dc.subject	Video özetleme	tr_TR
dc.subject	Bağımsız özyineli sinir ağı	tr_TR
dc.subject	Özyineli sinir ağı	tr_TR
dc.subject	Uzun kısa vadeli bellek	tr_TR
dc.subject	Tekdüzelik	tr_TR
dc.subject	Gözetimsiz	tr_TR
dc.title	Unsupervised Video Summarization With Independently Recurrent Neural Networks And Multiple Rewards	tr_eng
dc.title.alternative	Bağımsız Özyineli Sinir Ağları ve Çoklu Ödüller ile Gözetimsiz Video Özetleme	tr_TR
dc.type	info:eu-repo/semantics/masterThesis	tr_TR
dc.description.ozet	Son yıllarda dikkat çeken bir ivmeye sahip, ilgi çekici araştırma konularından biri olan video özetleme, uzun videoların, içeriğini olabildiğince geniş çaplı ifade edebilecek daha kısa ve özlü videolar haline getirilmesidir. Video özetleme görevi üzerinde yapılan son çalışmalarda uzun kısa vadeli belleklerde ve geçitli tekrarlayan ünitelerde kullanılan sigmoid ve hiperbolik tanjant etkilenim fonksiyonlarının katmanlar boyunca eğimin bozulmasına sebep olabileceği gözlemlenmektedir. Bununla birlikte özyineli sinir ağlarında bulunan nöronların birbirine dolanması nedeni ile ağ modellerinin yorumlanması ve geliştirilebilmesi zordur. Ayrıca uzun videolardan iyi bir özet çıkarabilmek için modelin zamansal tutarlılığı sürdürebilmesi gerekmektedir. Anahtar bölütlerdeki alakasız sıçramalar izleyicinin kafasını karıştırabilir. Bu sebeple modelin video özetini tekdüze olarak oluşturması gerekmektedir. Bu problemlerin giderilebilmesine yönelik olarak, bu çalışmamızda, gözetimsiz olarak video özetleme problemi için, bağımsız özyineli sinir ağları (Independently Recurrent Neural Network - BÖSA) ile derin pekiştirmeli öğrenmeyi bir arada kullanan bir yöntem önerilmektedir. Bu yöntemde eğimin bozulması ve ölü nöron problemleriyle başa çıkmak için etkilenim fonksiyonu olarak sızan doğrultulmuş doğrusal ünite kullanılmıştır. Bu model herhangi bir etikete veya kullanıcı etkileşimine ihtiyaç duymayan, birlikte hesaplanan, oluşturulan videonun tekdüzeliğinden, çeşitliliğinden ve ifade edilebilirliğinden oluşan bir ödül fonksiyonu ile tasarlanmıştır. Bu sayede model video özetini olabildiğince tekdüze oluşturabilir, eğim ile ilgili herhangi bir problem ile karşılaşmadan daha fazla katmana sahip olabilir ve daha fazla adım ile eğitilebilir. Video özetleme ile ilgili iki önemli denektaşı veri kümesinde yapılan deneylerde alınan sonuçlar, önerilen BÖSA tabanlı derin pekişkirmeli öğrenme yaklaşımının literatürde önerilen diğer yaklaşımlara oranla daha yüksek başarımlı sonuçlar ürettiğini göstermektedir.	tr_TR
dc.contributor.department	Bilgisayar Mühendisliği	tr_TR
dc.embargo.terms	Acik erisim	tr_TR
dc.embargo.lift	2019-11-26T13:55:38Z

Bu öğenin dosyaları:

Ad:: 10296515.pdf
Boyut:: 14.28Mb
Biçim:: PDF
Açıklama:: Tez Dosyası

Göster/Aç

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Bilgisayar Mühendisliği Bölümü Tez Koleksiyonu [212]

Basit öğe kaydını göster

Unsupervised Video Summarization With Independently Recurrent Neural Networks And Multiple Rewards

Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.