dc.contributor.advisor | Mehmet Önder, Efe | |
dc.contributor.author | Kurt, Ferhat | |
dc.date.accessioned | 2018-06-11T08:34:48Z | |
dc.date.available | 2018-06-11T08:34:48Z | |
dc.date.issued | 2018-05-29 | |
dc.date.submitted | 2018-05-29 | |
dc.identifier.uri | http://hdl.handle.net/11655/4536 | |
dc.description.abstract | In this study, literature review and experimental study were carried out on the hyperparameters constituting the structure, working system and network of the irregular neural networks that gained popularity in the definition of the day-to-day picture in 2012 within the scope of IMAGE-NET contest. In the study, ILSVRC2012 training dataset consisting of 50 classes and 600 samples and different option values for convolutional neural network hyperparameters were determined and trainings were conducted on the learning structure of the deep learning client, parameter and evaluation server included in the supercomputers. Consequently, these trainings, the model performances were evaluated through diagrams and charts and new hyper parameter values were created and additional trainings were made. As a result of 410 separate trainings in total, it has been determined that preprocessing of data sets, learning rate selection in accordance with optimizer, packet normalization and use of dropout process, increases model performance. | tr_TR |
dc.description.tableofcontents | ÖZET i
ABSTRACT ii
TEŞEKKÜR iii
İÇİNDEKİLER iv
ŞEKİLLER vii
ÇİZELGELER xi
KISALTMALAR xii
1. GİRİŞ 1
2. LİTERATÜR TARAMASI 4
2.1. Sinir Ağı / Çok Katmanlı Perseptron 4
2.1.1. Perseptron 4
2.1.2. İleriye Yayılım Modeli 5
2.1.3. Maliyet Fonksiyonu 7
2.1.4. Geri Yönde Yayılım 8
2.1.5. Hiper Parametreler 11
2.1.5.1. Öğrenme Katsayısı 11
2.1.5.2. Aktivasyon Fonksiyonu 12
2.1.5.3. Eniyileme Türleri 12
2.1.5.3.1. Eğim İnişi Türleri 12
2.1.5.3.2. Eğim Düşümü Eniyileme Algoritmaları 14
2.1.5.4. Ağın Genişliği ve Derinliği 20
2.1.5.5. Epok, Döngü Sayısı ve Paket Boyutu 21
2.1.5.6. Düzenlileştirme (Regularization) 22
2.1.5.7. Ağırlık Başlangıç Değerleri 23
2.2. Evrişimli Sinir Ağları 26
2.2.1. ESA Mimarisi 26
2.2.1.1. Evrişim Katmanı 27
2.2.1.2. Havuzlama Katmanı (Pooling) 32
2.2.1.3. Tam Bağlaşımlı Katman 33
2.2.2. Hiper Parametreler 33
2.2.2.1. Filtre Derinliği, Filtre Boyutu, Adım Sayısı ve Dolgu (Padding) 34
2.2.2.2. Havuzlama Boyutu ve Adım Sayısı 37
2.2.2.3. Paket Normalizasyonu 37
2.2.2.3.1. Evrişimli Ağlarda Paket Normalizasyonu 41
2.2.2.3.2. Paket Normalizasyon İşleminin Avantajları 41
2.2.3. Hazır Evrişimli Sinir Ağları 42
2.2.3.1. AlexNet Ağı 42
2.2.3.2. ZFNet Ağı 42
2.2.3.3. VGGNet Ağı 43
2.2.3.4. GoogleNet Ağı 44
2.2.3.5. Microsoft Resnet Ağı 47
2.2.3.6. Trimps-Soushen 48
2.2.3.7. SENet (Squeeze-and-Excitation Networks) 48
2.3. Veri Setleri 51
2.3.1. ImageNet Veri Seti 51
2.3.2. MS COCO Veri Seti 52
2.3.3. MNIST Veri Seti 53
2.3.4. CIFAR-10 / CIFAR-100 54
3. EVRİŞİMSEL SİNİR AĞLARININ OPTİMİZASYONU 55
3.1. Veri Seti Oluşturulması 56
3.2. Derin Öğrenme Kütüphane Seçimi 57
3.3. Hiper Parametre Seçimi 58
3.4. Derin Öğrenme Mimarisi 59
3.4.1. Parametre Sunucusu 59
3.4.2. Değerlendirme Sunucusu 60
3.4.3. Derin Öğrenme Eğitim İstemcileri 60
3.5. Derin Öğrenme Eğitimi İş Akışı 60
3.6. Eğitimin Genel Sonucu 63
3.6.1. 74. İşin Parametre Analizi 69
3.6.2. 110. İşin Parametre Analizi 73
3.7. Öğrenme Katsayısı Kıyaslaması 77
3.8. Ön İşleme Kıyaslaması 81
3.9. Paket Normalizasyonu ve Seyreltme İşlemi 83
3.10. Paket Sayısı Kıyaslaması 84
4. ÇIKARIM BAŞARIMI 87
5. SONUÇ 92
KAYNAKÇA 94
EKLER 98
EK-1: KERAS RESİM ÖN İŞLEME ARGÜMANLARI 98
EK-2: 288 EĞİTİM İŞİNİN HİPER PARAMETRE, EĞİTİM SÜRESİ VE BAŞARIMI 100
EK-3: 98 İLAVE EĞİTİM İŞİNİN HİPER PARAMETRE, EĞİTİM SÜRESİ VE BAŞARIMI 109
EK-4: ÖĞRENME KATSAYISI GÜNCELLEME 112
EK-5: SÖZLÜK 113
ÖZGEÇMİŞ 114 | tr_TR |
dc.language.iso | tur | tr_TR |
dc.publisher | Eğitim Bilimleri Enstitüsü | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | tr_TR |
dc.subject | Yapay Sinir Ağları | tr_TR |
dc.subject | Evrişimli Sinir Ağları | tr_TR |
dc.subject | Derin Öğrenme | tr_TR |
dc.subject | Hiper Parametre | tr_TR |
dc.subject | Eniyileme | tr_TR |
dc.title | Evrişimli Sinir Ağlarında Hiper Parametrelerin Etkisinin İncelenmesi | tr_TR |
dc.type | info:eu-repo/semantics/masterThesis | tr_TR |
dc.description.ozet | Bu çalışmada, IMAGE-NET yarışması kapsamında 2012 yılından günümüze resim tanımada popülerlik kazanan evrişimli sinir ağlarının yapısı, çalışma sistemi ve ağı oluşturan hiper parametreler konusunda literatür incelemesi ve deneysel çalışma yapılmıştır. Çalışmada, ILSVRC2012 eğitim verisinden 50 sınıf ve her sınıfa ait 600 örneklemden oluşan bir veri seti ile evrişimli sinir ağı hiper parametreleri için farklı seçenek değerleri belirlenmiş ve süper bilgisayarlarında dahil edildiği derin öğrenme istemcisi, parametre ve değerlendirme sunucusu mimari yapısı üzerinde eğitimler yapılmıştır. Yapılan eğitimler sonucunda şekil ve çizelgeler üzerinden model başarımları değerlendirilerek yeni hiper parametre değerleri oluşturulmuş ve ilave eğitimler yapılmıştır. Toplamda yapılan 410 farklı eğitim sonucunda veri setine ön işleme yapılması, aktivasyon fonksiyonuna göre öğrenme katsayısı seçimi, paket normalizasyonu ve seyreltme işleminin kullanılmasının model başarımını arttırdığı tespit edilmiştir. | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |