Veri maskeleme nedir?

Veri maskeleme, orijinal harflerini ve sayılarını değiştirerek verileri gizleme işlemidir. Düzenleme ve gizlilik gereklilikleri nedeniyle, kuruluşlar müşterileri ve operasyonları hakkında topladıkları hassas verileri korumalıdır. Veri maskeleme, gizli bilgileri değiştirerek bir kuruluşun verilerinin sahte sürümlerini oluşturur. Gerçekçi ve yapısal olarak benzer değişiklikler oluşturmak için çeşitli teknikler kullanılır. Veriler maskelendikten sonra orijinal veri kümesine erişmeden tersine mühendislik yapamaz veya orijinal veri değerlerine geri dönemezsiniz.

Veri maskelemenin kullanım örnekleri nelerdir?

Veri maskeleme teknikleri, bir kuruluşun Genel Veri Koruma Yönetmeliği (GDPR) gibi veri gizliliği düzenlemelerini karşılama çalışmalarını destekler. Kimliği tanımlayabilecek bilgiler (PII), finansal veriler, korunan sağlık bilgileri (PHI) ve fikri mülkiyet gibi birçok veri türünü koruyabilirsiniz.

Veri maskelemeye ilişkin kullanım senaryolarından bazılarını daha sonra inceleyeceğiz.

Güvenli geliştirme

Yazılım geliştirme ve test ortamları, test amacıyla gerçek dünya veri kümeleri gerektirir. Bununla birlikte, gerçek verilerin kullanılması güvenlik endişelerini artırmaktadır. Veri maskeleme, geliştiricilerin ve test kullanıcılarının orijinaline benzeyen gerçekçi test verileriyle hassas verileri ifşa etmeden çalışmasına olanak tanır. Bu, geliştirme ve test döngülerindeki güvenlik risklerini azaltır.

Analiz ve araştırma

Veri maskeleme, veri bilimcilerinin ve analistlerin bireysel gizlilikten ödün vermeden büyük veri kümeleriyle çalışmasına olanak tanır. Araştırmacılar verilerden değerli öngörüler ve eğilimler elde eder ve gizliliğin korunmasını sağlar. Örneğin, bilim insanları yeni ilaçların etki düzeyini incelemek, tedavi sonuçlarını analiz etmek veya olası yan etkileri araştırmak için anonimleştirilmiş veri kümelerini kullanabilir.

Harici iş birliği

Kuruluşların genellikle verileri harici ortaklarla, satıcılarla veya danışmanlarla paylaşması gerekir. Kuruluşlar, belirli alanları veya öznitelikleri maskeleyerek harici taraflarla iş birliği yaparken hassas verileri koruyabilir.

Çalışan eğitimi

Çalışan eğitim oturumları veya yazılım tanıtımları için veri maskeleme işleminden yararlanabilirsiniz. Kuruluşlar hassas verileri maskeleyerek, gerçek müşteri veya iş verilerini ifşa etmeden gerçekçi örnekler sunabilir. Çalışanlar, yetkisine sahip olmadıkları verilere erişmeye gerek kalmadan becerileri öğrenebilir ve uygulayabilir.

Veri maskeleme türleri nelerdir?

Yaygın veri maskeleme türlerinden bazılarını daha sonra ele alacağız.

Statik veri maskeleme

Statik veri maskeleme, depolanmadan veya paylaşılmadan önce hassas verilere sabit bir maskeleme kuralları kümesi uygulama işlemidir. Sık sık değişmeyen veya zaman içinde statik kalan veriler için yaygın olarak kullanılır. Kuralları önceden tanımlar ve tutarlı bir şekilde verilere uygularsınız. Bu da birden fazla ortamda tutarlı maskeleme sağlar.

Ayrıntılar karmaşık olsa da statik veri maskeleme sürecine genel bir göz atalım:

  1. Hassas verileri tanımlama ve anlama
  2. Maskeleme kuralları tasarlama ve geliştirme
  3. Uygun veri maskeleme algoritmalarını seçme
  4. Maskeleme kurallarını gerçek verilere uygulama

Daha sonra maskelenmiş verileri gerektiği gibi paylaşabilirsiniz.

Dinamik veri maskeleme

Dinamik veri maskeleme, maskeleme tekniklerini gerçek zamanlı olarak uygular. Kullanıcılar eriştikçe veya sorguladıkça mevcut hassas verileri dinamik olarak değiştirir. Öncelikli olarak müşteri desteği veya tıbbi kayıt işleme gibi uygulamalarda rol tabanlı veri güvenliğini uygulamak için kullanılır.

Dinamik veri maskeleme şu şekilde çalışır:

  1. Tüm kullanıcılar veritabanıyla bir proxy sunucusu aracılığıyla iletişim kurar
  2. Kullanıcılar verileri okumak istediğinde, veritabanı proxy'si kullanıcı rollerine, ayrıcalıklarına veya erişim izinlerine göre maskeleme kuralları uygular
  3. Yetkili kullanıcılar orijinal verileri alırken, yetkisiz kullanıcılar maskelenmiş verileri alır

Süreç önceden hazırlık gerektirmese de performansı etkileyebilir.

Deterministik veri maskeleme

Deterministik veri maskeleme, aynı girdi değerinin tutarlı bir şekilde aynı çıktı değerine maskelenmesini sağlar. Örneğin, belirli bir ad bir bulut sunucusunda "John" olarak maskelenirse sistem genelinde de her zaman "John" olarak maskelenir.

Deterministik maskeleme teknikleri genellikle orijinal veri sütunu ile maskelenmiş değerler arasında tutarlı bir eşlemenin korunduğu veri ikamesini veya belirteçlere ayırmayı içerir.

Anında veri maskeleme

Anında veri maskeleme, bellekteki hassas verileri maskeler ve bu nedenle değiştirilen verileri veritabanında depolamaya gerek yoktur. Sürekli dağıtım işlem hatlarında veya verilerin üretim ve üretim dışı ortamlar arasında sık sık taşındığı karmaşık entegrasyon senaryolarında kullanışlıdır. Uygulama, işlem hattındaki gerekli aşamada verileri maskeler ve ardından işlem hattındaki bir sonraki aşamaya aktarır.

İstatistiksel gizleme

İstatistiksel veri gizleme, hassas verilerin değerlerinin, veriler içindeki istatistiksel özellikleri ve ilişkileri koruyabilecek şekilde değiştirilmesini içerir. Maskelenmiş verilerin, doğru istatistiksel analiz için orijinal verilerin genel dağılımını,örüntülerini ve ilişkilerini korumasını sağlar. İstatistiksel veri gizleme teknikleri, verilere matematiksel işlevlerin veya pertürbasyon algoritmalarının uygulanmasını içerir.

Bazı yaygın veri maskeleme teknikleri nelerdir?

Veri koruması için kullanabileceğiniz çeşitli algoritmalar vardır. Yaygın veri maskeleme yöntemlerinden bazılarını burada bulabilirsiniz.

Rastgeleleştirme

Rastgeleleştirme ile hassas verileri, orijinal verilerle hiçbir ilişkisi olmayan, rastgele oluşturulmuş değerlerle değiştirirsiniz. Örneğin adları, adresleri veya kimliği tanımlayabilecek diğer bilgileri kurgusal veya rastgele seçilmiş değerlerle değiştirebilirsiniz.

İkame

İkame maskeleme, hassas verilerin benzer ancak kurgusal verilerle değiştirilmesini içerir. Örneğin, gerçek adları önceden tanımlanmış bir listedeki adlarla değiştirebilirsiniz. Algoritmaları, benzer ancak sahte kredi kartı numaraları oluşturmak için de kullanabilirsiniz.

Karıştırma

Karıştırma ile, istatistiksel özellikleri korumak ve tek tek kayıtları tanımlanamaz hale getirmek için veri kümesindeki değerleri yeniden sıralayabilirsiniz. Bu teknik, veri içindeki ilişkileri korumak için yaygın olarak kullanılır.

Örneğin, bir veri tablosunda, satır değerlerinin değişmesi için sütun verilerini rastgele karıştırabilirsiniz. Pratik olarak, adları ve iletişim bilgilerini değiştirirken bir müşteri ile işlemleri arasındaki ilişkiyi koruyabilirsiniz.

Şifreleme

Şifreleme maskeleme ile hassas verileri şifreleme algoritmaları kullanarak şifrelersiniz. Verileri okunamayan bir biçime dönüştürürsünüz ve yalnızca şifre çözme anahtarlarına sahip yetkili kullanıcılar orijinal verilere erişebilir. Bu teknik daha yüksek düzeyde veri güvenliği sağlar ancak veri analizi için şifre çözme gerektiğinden sorgu performansını etkiler.

Karma

Karma, verileri sabit uzunlukta bir karakter dizisine dönüştüren bir dönüştürme tekniğidir. Parolaları veya genellikle orijinal değerin gerekli olmadığı ve yalnızca verileri doğrulamanız gerektiği diğer hassas bilgileri maskelemek için kullanılır.

Belirteçlere ayırma

Belirteçlere ayırma ile üretim verilerini rastgele oluşturulmuş bir belirteç veya referans değeriyle değiştirirsiniz. Orijinal verileri ayrı bir güvenli konumda saklar ve belirteci işleme veya analiz sırasında ikame olarak kullanırsınız. Belirteçlere ayırma, hassas bilgilerin açığa çıkma riskini en aza indirirken veri bütünlüğünün korunmasına yardımcı olur.

Sıfırlama

Sıfırlama (veya karartma), hassas verileri boş değerler veya boş alanlarla değiştiren bir veri maskeleme çözümüdür. Bu, verileri veri kümesinden etkili bir şekilde kaldırır. Bu yaklaşım, verilerin biçimini veya yapısını korumak istediğiniz ancak belirli bilgilerin gizlenmesi gerektiği durumlar için uygundur.

Veri maskelemenin zorlukları nelerdir?

Sonrasında, veri maskeleme konusundaki bazı yaygın zorlukları tartışacağız.

Öznitelik koruma

Veri maskelemenin belirli veri türleri için orijinal veri özniteliklerini koruması, araştırma ve analiz bakımından önemlidir. Veri maskeleme araçlarınızın orijinal veri türlerini veya ilişkili veri kategorilerinin sıklığını koruduğundan emin olmak istersiniz.

Örneğin bir araç, kredi kartı ayrıntılarını gizlerken müşteri verilerinin veya kart kategorisi istatistiklerinin demografik gösterimini değiştirirse bu, analizi etkileyebilir. Öznitelik koruması, rastgeleleştirme veya belirteçlere ayırma gibi belirli veri maskeleme süreçlerinde zorlayıcı hale gelebilir.

Anlamsal bütünlük

Oluşturulan sahte değerler, farklı veri türleriyle ilişkili iş kurallarına ve kısıtlamalarına uymalıdır. Örneğin, maaşlar belirli bir aralığa girmeli ve ulusal kimlik numaraları önceden belirlenmiş bir biçimi takip etmelidir. Anlamsal bütünlüğü korumak zordur ancak maskelenmiş verilerin anlamlı ve gerçekçi kalmasını sağlar.

Veri benzersizliği

Orijinal verilerin çalışan kimlik numaraları gibi benzersizlik gerektirdiği durumlarda, veri maskeleme tekniği orijinal verileri değiştirmek için benzersiz değerler sağlamalıdır. Anahtar alanlarda benzersizliğin olmaması potansiyel çatışmalar veya tutarsızlıklar yaratabilir.

Mevcut iş akışlarıyla entegrasyon

Veri maskelemeyi, özellikle uygulamanın ilk aşamalarında mevcut iş akışlarına entegre etmek zor olabilir. Çalışanlar, yeni süreçlere ve teknolojilere uyum sağlama sürecinde sorun yaşayabilirler. Sorunsuz bir entegrasyon ve minimum kesinti sağlamak için kuruluşunuz dikkatli planlamaya, paydaş iş birliğine ve kullanıcı endişelerini gidermeye odaklanmalıdır.

AWS, veri maskeleme gereksinimlerinizi nasıl destekleyebilir?

Yerleşik veri maskeleme özelliklerine sahip birçok Amazon Web Services (AWS) teklifi vardır. Aşağıda birkaç örnek verilmiştir:

  • Amazon Transcribe, konuşmayı otomatik olarak metne dönüştürür ve hassas verileri istendiği gibi maskeleyebilir.
  • Amazon Redshift; veri ambarları, operasyonel veritabanları ve veri gölleri genelinde yapılandırılmış ve yarı yapılandırılmış verileri analiz etmek için SQL kullanır. Rol tabanlı erişim denetimi, satır düzeyinde güvenlik, sütun düzeyinde güvenlik ve dinamik veri maskeleme tekniklerini destekler.
  • Amazon Basit Bildirim Hizmeti (Amazon SNS) bir bildirim hizmetidir. Bu hizmeti, aktarımdaki hassas verileri keşfedebilen, maskeleyebilen ve koruyabilen veri koruma ilkeleri tanımlamak için kullanabilirsiniz.

Karmaşık veri maskeleme gereksinimleri için mevcut uygulama kılavuzlarımız da mevcuttur. Örneğin, yapay zeka destekli Sağlık Verilerini Maskeleme kılavuzu, sağlık kuruluşlarının görüntü veya metinlerdeki sağlık verilerini tanımlamasına ve maskelemesine yardımcı olur. Bu kılavuz aşağıdaki hizmetleri kullanır:

Ayrıca AWS pazar yerindeki önceden hazırlanmış veri maskeleme çözümlerinden birini seçmeyi de düşünebilirsiniz. 

Hemen bir hesap oluşturarak AWS'de veri maskelemeyi kullanmaya başlayın.

AWS İçin Sonraki Adımlar

Ücretsiz bir hesap için kaydolun

AWS Ücretsiz Kullanım için anında erişim elde edin.

Kaydolun 
Konsolda oluşturmaya başlayın

AWS Yönetim Konsolu'nda oluşturmaya başlayın.

Oturum açın