Basit öğe kaydını göster

dc.contributor.advisorAlkar , Ali Ziya
dc.contributor.authorAfyonluoğlu , Mustafa
dc.date.accessioned2019-10-21T12:00:42Z
dc.date.issued2019
dc.date.submitted2019-06-24
dc.identifier.citationM.Afyonluoğlu, Kişisel Verilerin Anonimleştirilmesinin İyileştirilmesine Yönelik Bir Model Geliştirilmesi ve e-Devlet Alanında Uygulanması, Doktora Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 2019.tr_TR
dc.identifier.urihttp://hdl.handle.net/11655/9294
dc.description.abstractNowadays, the realization that the data emerged through e-Government services is a valuable resource in many fields such as statistics, research and development, artificial intelligence training, service improvement and projection development has increased the need to obtain this data for processing. However, an important part of this large volume of data arising from e-Government services consists of personal data. Privacy is protected by the legislation infrastructure, both in international organizations such as the European Union, with the General Data Protection Regulation (GDPR) and in our country the Law on Protection of Personal Data No. 6698, and anonymization is required for sharing personal data. By means of anonymization with methods such as generalizing or masking certain parts of the data, said data cannot be associated with a single person. K-anonymity, the most well-known of the privacy standards in this regard (provides privacy by keeping individuals in at least k groups of records of the same quasi-identifier value), l -diversity (requires that each equivalence class has at least l well-represented values for each sensitive attribute) and t-closeness (requires that the distribution of a sensitive attribute in any equivalence class is close to the distribution of the attribute in the overall table, so the distance between the two distributions should be no more than a threshold t), resulting in a certain level of data loss due to generalization on the data, which reduces the expected benefit from the resulting data set. In this doctoral study, an innovative, aim oriented, applicable to any kind of data set including e-Government data, adaptive and dynamic anonymization model (ADAM) was introduced by minimizing data benefit loss and providing high improvements in the number of fully suppressed records, taking into account the content of data and adaptively creating records specific to groups. Since e-Government data sets are composed of large volumes, the model introduced should provide the expected improvement in high data volumes. Therefore, in order to measure the level of improvement provided by this heuristic method, an application has been developed which produces synthetic data in the field of health which is one of the important application fields of e-Government and ADAM algorithm has been applied gradually by creating synthetic data sets of starting from 1.000 data sets up to 100.000 people and it has been shown that the proposed model can provide significant improvements compared to existing anonymization methodstr_TR
dc.description.tableofcontentsÖZET i ABSTRACT iii TEŞEKKÜR v İÇİNDEKİLER vii ŞEKİLLER DİZİNİ xi ÇİZELGELER DİZİNİ xvii SİMGELER VE KISALTMALAR xxi 1. GİRİŞ 1 2. E-DEVLET VE ÖLÇÜMLEME 9 2.1. Kamu hizmetlerinde teknolojinin kullanımı 9 2.2. e-Devlet’e İlişkin Kavramlar 10 2.3. Bilgi Toplumunda e-Devlet’in Yeri ve Verinin Önemi 11 2.4. Başarılı e-Devlet Projelerinde Sağlanan Tasarruflar 13 2.5. e-Devlet Olgunluk Ölçümlemesi 25 2.5.1 Uluslararası e-Devlet Ölçümleme Çalışmaları 25 2.5.2 E-Devlet Ölçümlemelerine İlişkin Yapılan Çalışmalar 30 2.5.3 Tespit ve Değerlendirmeler 40 2.6. Başarıyı Arttırma Yöntemi: e-Devlet Yazılım Çerçevesi Modeli 41 2.6.1 Dünya Genelinde Yazılım Çerçeveleri 44 2.6.2 Yapılan Çalışmalar 48 2.6.3 Yazılım Çerçevesi Modelinden Beklenen Faydalar 50 3. VERİ GÜVENLİĞİ, KİŞİSEL VERİLER VE VERİ İMHASI 53 3.1. Kişisel Verilere İlişkin Kavramlar 55 3.2. Kişisel Veriler ve Veri İmhası 57 3.2.1 Sosyal Medya ve Kişisel Veriler 59 3.2.2 Kişisel Veri İmhası 70 3.2.3 Kişisel Verilerde Anonimleştirmeye İlişkin Yapılan Çalışmalar 72 3.2.4 İlişkisel Veri Tabanlarında Kişisel Veriler 78 3.3. Mevzuatta Kişisel Veri İmhası 80 3.4. Kişisel Veri İmhasındaki Pratik Güçlükler 83 3.5. Anonimleştirme Yöntemleri 88 3.6. De-anonimleştirmeye Yönelik Güvenlik Problemleri 92 3.7. Bilgi Kaybı Ölçütleri 93 3.8. Veri Tabanında Tutulma Şekline Göre Veri Türleri 93 3.9. Anonimleştirme Öncesi İşlem Yapılacak Veride İncelenmesi Gereken Özellikler ……………………………………………………………………………94 4. KİŞİSELVERİLER İÇİN ADAPTİF DİNAMİK ANONİMLEŞTİRME MODELİ (ADAM) 97 4.1. Mevcut Anonimleştirme Algoritmaları 97 4.2. Dinamik Anonimleştirme Modeli (DAM) 107 4.2.1 Çoklu Yarı Tanımlayıcı Veri Seti için DAM 117 4.3. Adaptif Dinamik Anonimleştirme Modeli (ADAM) 120 4.3.1 Çoklu Yarı Tanımlayıcı Veri Seti için DAM 125 4.4. Fayda Analizi: Kavram İspatı Çalışması 125 4.4.1 Doğrulama Aracı 130 4.4.2 Doğrulama Aracının Doğrulanması 136 4.4.3 e-Devlet Sağlık Alanı Sentetik Veri Üretim Aracı 141 4.4.4 Kurumsal Kişisel Veri Yönetimi Simülasyonu İşleyişi 163 4.4.5 Veri Haritalama 165 4.4.6 Kayıt İmha Merkezi 166 4.4.7 Kavram İspatı Senaryoları 167 4.4.8 Kişisel Veri Kayıt İmha Merkezi İşleyişi 182 4.4.9 Sosyal Medya Ortamında Kişisel Verilerin Bütünlüğü 183 4.4.10 Adaptif Dinamik Anonimleştirme Modeli Fayda Analizi 185 4.4.11 Çoklu Yarı Tanımlayıcı İçin Kavram İspatı Çalışması 201 5. SONUÇLAR 205 5.1. Sonuçlar 205 5.2. Önerilen Çalışmalar 208 6. KAYNAKLAR 211 7. EKLER 225 EK- 1: e-Devlet Ölçümleme Çalışmaları Analiz Tablosu 225 EK- 2: e-Devlet Ölçümleme ve Çerçeve SLR Çalışması 243 EK- 3: Uluslararası e-Devlet ölçümleme çalışmalarının Kıyaslanması 273 EK- 4: Sentetik Veri Üretim Örneği 279 Ek 4-1: Doğrulama Aracının Doğrulanması için Kullanılan Sentetik Veri 287 EK- 5: TCKN Alanı için Anonimleştirme Analizi 289 1.000 Kayıtlı Veri Setinde k=3 için Dinamik Anonimleştirme Analizi 289 1.000 Kayıtlı Veri Setinde k=3 için Adaptif Dinamik Anonimleştirme Analizi 293 5.000 Kayıtlı Veri Setinde k=3 için Dinamik Anonimleştirme Analizi 295 5.000 Kayıtlı Veri Setinde k=3 için Adaptif Dinamik Anonimleştirme Analizi 299 10.000 Kayıtlı Veri Setinde k=3 için Dinamik Anonimleştirme Analizi 300 10.000 Kayıtlı Veri Setinde k=3 için Adaptif Dinamik Anonimleştirme Analizi 307 EK- 6: Posta Kodu Alanı için Anonimleştirme Analizi 311 1.000 Kayıtlı Veri Setinde k=2 için Dinamik Anonimleştirme Analizi 311 1.000 Kayıtlı Veri Setinde k=3 için Dinamik Anonimleştirme Analizi 312 1.000 Kayıtlı Veri Setinde k=4 için Dinamik Anonimleştirme Analizi 313 5.000 Kayıtlı Veri Setinde k=2 için Dinamik Anonimleştirme Analizi 314 5.000 Kayıtlı Veri Setinde k=3 için Dinamik Anonimleştirme Analizi 316 5.000 Kayıtlı Veri Setinde k=4 için Dinamik Anonimleştirme Analizi 317 1.000 Kayıtlı Veri Setinde k=2 için Adaptif Dinamik Anonimleştirme Analizi 318 1.000 Kayıtlı Veri Setinde k=3 için Adaptif Dinamik Anonimleştirme Analizi 319 1.000 Kayıtlı Veri Setinde k=4 için Adaptif Dinamik Anonimleştirme Analizi 320 5.000 Kayıtlı Veri Setinde k=2 için Adaptif Dinamik Anonimleştirme Analizi 321 5.000 Kayıtlı Veri Setinde k=3 için Adaptif Dinamik Anonimleştirme Analizi 321 5.000 Kayıtlı Veri Setinde k=4 için Adaptif Dinamik Anonimleştirme Analizi 322 EK- 7: Farklı Frekanslara Sahip Alanların Veri Fayda Kayıp Analizi 325 EK- 8: Bileşik Alan Anonimlik Analizi 327 Ek 8-1: Birden Fazla Yarı Tanımlayıcı İçin Bileşik Eş Değerlik Sınıf ve Frekans Analizi 327 Ek 8-2: Birden Fazla Yarı Tanımlayıcı İçin Hiyerarşi Ağacı Tabanlı Dinamik Anonimleştirme Analizi 329 Ek 8-3: Hiyerarşi Ağacı ADAM Uygulaması İşleyiş Tablosu 331 EK- 9: Anonimleştirme Alanındaki Akademik Çalışmaların Kategorik Şeması 333 EK- 10: Tezden Türetilmiş Bildiriler 334 EK- 11: Tez Çalışması Orjinallik Raporu 336 ÖZGEÇMİŞ 338tr_TR
dc.language.isoturtr_TR
dc.publisherFen Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccesstr_TR
dc.subjectKişisel veritr_TR
dc.subjectAnonimleştirmetr_TR
dc.subjecte-Devlettr_TR
dc.subjectk-anonimliktr_TR
dc.subjectAdaptif dinamik anonimleştirmetr_TR
dc.subject.lcshKonu Başlıkları Listesi::Teknoloji. Mühendisliktr_TR
dc.titleKişisel Verilerin Anonimleştirilmesinin İyileştirilmesine Yönelik Bir Model Geliştirilmesi ve E-Devlet Alanında Uygulanmasıtr_TR
dc.title.alternativeDevelopment Of A Model For Improving Personal Data Anonymization And Case Study In E-Governmenttr_eng
dc.typeinfo:eu-repo/semantics/doctoralThesistr_TR
dc.description.ozetGünümüzde, e-Devlet hizmetleri sayesinde ortaya çıkan verinin istatistik, araştırma-geliştirme, yapay zekâ öğrenimi, hizmet iyileştirme, projeksiyon geliştirme başta olmak üzere pek çok alanda değerli bir kaynak olduğunun fark edilmesi, bu veriyi işlemek üzere elde etme ihtiyacını arttırmıştır. Ancak e-Devlet hizmetlerinden doğan bu büyük hacimli verinin önemli bir bölümü kişisel verilerden oluşmaktadır ve mahremiyetin korunmasına yönelik olarak gerek Avrupa Birliği gibi uluslararası kuruluşlarda Genel Veri Koruma Tüzüğü (GDPR) ile gerekse ülkemizde 6698 sayılı Kişisel Verilerin Korunması Kanunu gibi mevzuat altyapısı ile korunmakta ve verinin paylaşımı için anonimleştirme şart koşulmaktadır. Verinin belli kısımlarının kapatılması veya genelleştirilmesi gibi yöntemlerle gerçekleştirilen anonimleştirme ile söz konusu veri, bir gerçek kişi ile ilişkilendirilemeyecek hale getirilmektedir. Bu konudaki mahremiyet standartlarının en bilineni olan k-anonimlik (kişileri aynı yarı tanımlayıcı değere sahip en az k tane kayıt grupları şeklinde tutarak mahremiyeti sağlar), l -çeşitlilik (her bir denklik sınıfının her hassas özellik için en az l adet değere sahip olmasını gerektirir) ve t-yakınlık (herhangi bir denklik sınıfında hassas özniteliğin dağılımının, özniteliğin veri setindeki dağılımına yakın olmasını, yani bu iki dağılım arasındaki mesafenin t eşik değerinden fazla olmamasını gerektirir) uygulamasında, veri üzerinde yapılan genelleştirme işlemleri sebebiyle, belirli seviyede veri kaybı oluşmakta ve bu durum, sonuç veri kümesinden elde edilmesi beklenen faydayı azaltmaktadır. Bu doktora çalışmasında, veri niteliğini dikkate alarak ve kayda özelleşmiş grupları adaptif şekilde oluşturarak veri fayda kaybını en aza indirgeyen ve tam baskılanan kayıtların sayısında yüksek oranda iyileştirmeler sağlayan, hedef odaklı, e-Devlet verisi dahil olmak üzere her türlü veri setine uygulanabilen, yenilikçi bir adaptif ve dinamik anonimleştirme modeli (ADAM) ortaya konulmuştur. e-Devlet veri kümeleri büyük hacimlerden oluştuğu için, ortaya konulan modelin, yüksek veri hacimlerinde de beklenen iyileştirmeyi sağlaması gerekmektedir. Bu sebeple, bu buluşsal yöntemin sağlayacağı iyileştirme seviyesini ölçebilmek için, e-Devletin önemli uygulama alanlarından birisi olan sağlık alanında sentetik veri üreten bir uygulama geliştirilmiş ve 1.000 kişilik veri setlerinden başlayarak kademeli olarak 100.000 kişilik sentetik veri setleri oluşturularak ADAM algoritması uygulanmış, mevcut anonimleştirme yöntemlerine kıyasla önerilen modelin önemli ölçüde iyileştirmeler sağlayabildiği gösterilmiştir.tr_TR
dc.contributor.departmentElektrik –Elektronik Mühendisliğitr_TR
dc.embargo.termsAcik erisimtr_TR
dc.embargo.lift-
dc.identifier.ORCIDhttps://orcid.org/0000-0003-2441-1720tr_TR
dc.subject.ieeeIEEE Thesaurus Terms::Computers and information processing::Data privacytr_TR
dc.subject.ericERIC Thesaurus::Social Processes and Structures::Privacytr_TR
dc.subject.jitaJITA Classification System of Library and Information Science::Information technology and library technology::None of these, but in this sectiontr_TR


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster