dc.contributor.advisorERKENT, ÖZGÜR
dc.contributor.authorÇİFCİ, Ahmet Gazi
dc.contributor.authorÇİFCİ, AHMET GAZİ
dc.description.abstractIn recent years, the utilization of drones has seen a remarkable increase across various sectors, including surveillance, delivery services, and environmental monitoring. This surge is largely attributed to advancements in drone technology, making them more accessible and versatile. Among the capabilities that distinguish drones, agile flight emerges as a paramount feature, enabling drones to navigate complex environments with precision and efficiency. However, achieving agile flight in dynamic environments presents significant challenges, particularly in terms of rapid trajectory re-planning and computational demands. This thesis proposes a novel approach to agile drone navigation by integrating Reinforcement Learning (RL) and Imitation Learning (IL). The methodology includes training a state-based teacher policy using the Proximal Policy Optimization (PPO) algorithm, which has access to comprehensive environmental information, including obstacle velocities. Subsequently, a student policy is trained through Behavioral Cloning (BC) to navigate without direct velocity information, relying instead on recurrent neural network architectures to infer this data. Experimental results demonstrate that the proposed method significantly enhances the agility and efficiency of drones in dynamic environments. The combination of RL and IL techniques not only reduces the computational burden but also shortens the training time, facilitating quicker adaptation and improved performance. The findings of this study contribute to advancing autonomous drone technology, offering a robust solution for navigating through cluttered and unpredictable environments. The project can be found in this link: flighttr_TR
dc.publisherFen Bilimleri Enstitüsütr_TR
dc.subjectAgile Drone Flighttr_TR
dc.subjectReinforcement Learningtr_TR
dc.subjectDynamic Obstacle Avoidancetr_TR
dc.subjectHigh-Speed Navigationtr_TR
dc.subjectImitation Learningtr_TR
dc.subject.lcshBilgisayar mühendisliğitr_TR
dc.description.ozetSon yıllarda, dronların kullanımı çeşitli sektörlerde, özellikle gözetim, teslimat hizmetleri ve çevre izleme alanlarında dikkate değer bir artış göstermiştir. Bu artış, drone teknolojisindeki ilerlemelere, dronların daha erişilebilir ve çok yönlü hale gelmesine büyük ölçüde atfedilmektedir. Dronları ayıran yetenekler arasında, çevik uçuş öne çıkarak dronların karmaşık ortamlarda hassasiyet ve verimlilikle gezinmelerini sağlamaktadır. Ancak, dinamik ortamlarda çevik uçuş elde etmek, özellikle hızlı rota yeniden planlama ve hesaplama gereksinimleri açısından önemli zorluklar sunmaktadır. Bu tez, Takviyeli Öğrenme (RL) ve Taklit Öğrenme’yi (IL) entegre ederek çevik drone navigasyonu için yeni bir yaklaşım önermektedir. Metodoloji, engel hızları da dahil olmak üzere kapsamlı çevresel bilgilere erişimi olan Proximal Policy Optimization (PPO) algoritması kullanılarak duruma dayalı bir öğretmen politikası eğitmeyi içermektedir. Daha sonra, doğrudan hız bilgisi olmadan gezinecek olan öğrenci politikası, bu veriyi çıkarmak için tekrarlı sinir ağı mimarilerine dayanarak Davranış Klonlama (BC) yoluyla eğitilmektedir.Deneysel sonuçlar, önerilen metodun dinamik ortamlarda dronların çevikliğini ve verimliliğini önemli ölçüde artırdığını göstermektedir. RL ve IL tekniklerinin kombinasyonu, hesaplama yükünü azaltmanın yanı sıra eğitim süresini kısaltarak daha hızlı uyum ve gelişmiş performans sağlamaktadır. Bu çalışmanın bulguları, dağınık ve öngörülemeyen ortamlarda gezinmek için sağlam bir çözüm sunarak otonom drone teknolojisinin ilerlemesine katkıda bulunmaktadır. Project bu linkte bulunabilir: flighttr_TR
dc.contributor.departmentBilgisayar Mühendisliğitr_TR
dc.embargo.terms6 aytr_TR

