Veri maskeleme nedir?
Veri maskeleme, orijinal harflerini ve sayılarını değiştirerek verileri gizleme işlemidir. Düzenleme ve gizlilik gereklilikleri nedeniyle, kuruluşlar müşterileri ve operasyonları hakkında topladıkları hassas verileri korumalıdır. Veri maskeleme, gizli bilgileri değiştirerek bir kuruluşun verilerinin sahte sürümlerini oluşturur. Gerçekçi ve yapısal olarak benzer değişiklikler oluşturmak için çeşitli teknikler kullanılır. Veriler maskelendikten sonra orijinal veri kümesine erişmeden tersine mühendislik yapamaz veya orijinal veri değerlerine geri dönemezsiniz.
Veri maskelemenin kullanım örnekleri nelerdir?
Veri maskeleme teknikleri, bir kuruluşun Genel Veri Koruma Yönetmeliği (GDPR) gibi veri gizliliği düzenlemelerini karşılama çalışmalarını destekler. Kimliği tanımlayabilecek bilgiler (PII), finansal veriler, korunan sağlık bilgileri (PHI) ve fikri mülkiyet gibi birçok veri türünü koruyabilirsiniz.
Veri maskelemeye ilişkin kullanım senaryolarından bazılarını daha sonra inceleyeceğiz.
Güvenli geliştirme
Yazılım geliştirme ve test ortamları, test amacıyla gerçek dünya veri kümeleri gerektirir. Bununla birlikte, gerçek verilerin kullanılması güvenlik endişelerini artırmaktadır. Veri maskeleme, geliştiricilerin ve test kullanıcılarının orijinaline benzeyen gerçekçi test verileriyle hassas verileri ifşa etmeden çalışmasına olanak tanır. Bu, geliştirme ve test döngülerindeki güvenlik risklerini azaltır.
Analiz ve araştırma
Veri maskeleme, veri bilimcilerinin ve analistlerin bireysel gizlilikten ödün vermeden büyük veri kümeleriyle çalışmasına olanak tanır. Araştırmacılar verilerden değerli öngörüler ve eğilimler elde eder ve gizliliğin korunmasını sağlar. Örneğin, bilim insanları yeni ilaçların etki düzeyini incelemek, tedavi sonuçlarını analiz etmek veya olası yan etkileri araştırmak için anonimleştirilmiş veri kümelerini kullanabilir.
Harici iş birliği
Kuruluşların genellikle verileri harici ortaklarla, satıcılarla veya danışmanlarla paylaşması gerekir. Kuruluşlar, belirli alanları veya öznitelikleri maskeleyerek harici taraflarla iş birliği yaparken hassas verileri koruyabilir.
Çalışan eğitimi
Çalışan eğitim oturumları veya yazılım tanıtımları için veri maskeleme işleminden yararlanabilirsiniz. Kuruluşlar hassas verileri maskeleyerek, gerçek müşteri veya iş verilerini ifşa etmeden gerçekçi örnekler sunabilir. Çalışanlar, yetkisine sahip olmadıkları verilere erişmeye gerek kalmadan becerileri öğrenebilir ve uygulayabilir.
Veri maskeleme türleri nelerdir?
Yaygın veri maskeleme türlerinden bazılarını daha sonra ele alacağız.
Statik veri maskeleme
Statik veri maskeleme, depolanmadan veya paylaşılmadan önce hassas verilere sabit bir maskeleme kuralları kümesi uygulama işlemidir. Sık sık değişmeyen veya zaman içinde statik kalan veriler için yaygın olarak kullanılır. Kuralları önceden tanımlar ve tutarlı bir şekilde verilere uygularsınız. Bu da birden fazla ortamda tutarlı maskeleme sağlar.
Ayrıntılar karmaşık olsa da statik veri maskeleme sürecine genel bir göz atalım:
- Hassas verileri tanımlama ve anlama
- Maskeleme kuralları tasarlama ve geliştirme
- Uygun veri maskeleme algoritmalarını seçme
- Maskeleme kurallarını gerçek verilere uygulama
Daha sonra maskelenmiş verileri gerektiği gibi paylaşabilirsiniz.
Dinamik veri maskeleme
Dinamik veri maskeleme, maskeleme tekniklerini gerçek zamanlı olarak uygular. Kullanıcılar eriştikçe veya sorguladıkça mevcut hassas verileri dinamik olarak değiştirir. Öncelikli olarak müşteri desteği veya tıbbi kayıt işleme gibi uygulamalarda rol tabanlı veri güvenliğini uygulamak için kullanılır.
Dinamik veri maskeleme şu şekilde çalışır:
- Tüm kullanıcılar veritabanıyla bir proxy sunucusu aracılığıyla iletişim kurar
- Kullanıcılar verileri okumak istediğinde, veritabanı proxy'si kullanıcı rollerine, ayrıcalıklarına veya erişim izinlerine göre maskeleme kuralları uygular
- Yetkili kullanıcılar orijinal verileri alırken, yetkisiz kullanıcılar maskelenmiş verileri alır
Süreç önceden hazırlık gerektirmese de performansı etkileyebilir.
Deterministik veri maskeleme
Deterministik veri maskeleme, aynı girdi değerinin tutarlı bir şekilde aynı çıktı değerine maskelenmesini sağlar. Örneğin, belirli bir ad bir bulut sunucusunda "John" olarak maskelenirse sistem genelinde de her zaman "John" olarak maskelenir.
Deterministik maskeleme teknikleri genellikle orijinal veri sütunu ile maskelenmiş değerler arasında tutarlı bir eşlemenin korunduğu veri ikamesini veya belirteçlere ayırmayı içerir.
Anında veri maskeleme
Anında veri maskeleme, bellekteki hassas verileri maskeler ve bu nedenle değiştirilen verileri veritabanında depolamaya gerek yoktur. Sürekli dağıtım işlem hatlarında veya verilerin üretim ve üretim dışı ortamlar arasında sık sık taşındığı karmaşık entegrasyon senaryolarında kullanışlıdır. Uygulama, işlem hattındaki gerekli aşamada verileri maskeler ve ardından işlem hattındaki bir sonraki aşamaya aktarır.
İstatistiksel gizleme
İstatistiksel veri gizleme, hassas verilerin değerlerinin, veriler içindeki istatistiksel özellikleri ve ilişkileri koruyabilecek şekilde değiştirilmesini içerir. Maskelenmiş verilerin, doğru istatistiksel analiz için orijinal verilerin genel dağılımını,örüntülerini ve ilişkilerini korumasını sağlar. İstatistiksel veri gizleme teknikleri, verilere matematiksel işlevlerin veya pertürbasyon algoritmalarının uygulanmasını içerir.
Bazı yaygın veri maskeleme teknikleri nelerdir?
Veri koruması için kullanabileceğiniz çeşitli algoritmalar vardır. Yaygın veri maskeleme yöntemlerinden bazılarını burada bulabilirsiniz.
Rastgeleleştirme
Rastgeleleştirme ile hassas verileri, orijinal verilerle hiçbir ilişkisi olmayan, rastgele oluşturulmuş değerlerle değiştirirsiniz. Örneğin adları, adresleri veya kimliği tanımlayabilecek diğer bilgileri kurgusal veya rastgele seçilmiş değerlerle değiştirebilirsiniz.
İkame
İkame maskeleme, hassas verilerin benzer ancak kurgusal verilerle değiştirilmesini içerir. Örneğin, gerçek adları önceden tanımlanmış bir listedeki adlarla değiştirebilirsiniz. Algoritmaları, benzer ancak sahte kredi kartı numaraları oluşturmak için de kullanabilirsiniz.
Karıştırma
Karıştırma ile, istatistiksel özellikleri korumak ve tek tek kayıtları tanımlanamaz hale getirmek için veri kümesindeki değerleri yeniden sıralayabilirsiniz. Bu teknik, veri içindeki ilişkileri korumak için yaygın olarak kullanılır.
Örneğin, bir veri tablosunda, satır değerlerinin değişmesi için sütun verilerini rastgele karıştırabilirsiniz. Pratik olarak, adları ve iletişim bilgilerini değiştirirken bir müşteri ile işlemleri arasındaki ilişkiyi koruyabilirsiniz.
Şifreleme
Şifreleme maskeleme ile hassas verileri şifreleme algoritmaları kullanarak şifrelersiniz. Verileri okunamayan bir biçime dönüştürürsünüz ve yalnızca şifre çözme anahtarlarına sahip yetkili kullanıcılar orijinal verilere erişebilir. Bu teknik daha yüksek düzeyde veri güvenliği sağlar ancak veri analizi için şifre çözme gerektiğinden sorgu performansını etkiler.
Karma
Karma, verileri sabit uzunlukta bir karakter dizisine dönüştüren bir dönüştürme tekniğidir. Parolaları veya genellikle orijinal değerin gerekli olmadığı ve yalnızca verileri doğrulamanız gerektiği diğer hassas bilgileri maskelemek için kullanılır.
Belirteçlere ayırma
Belirteçlere ayırma ile üretim verilerini rastgele oluşturulmuş bir belirteç veya referans değeriyle değiştirirsiniz. Orijinal verileri ayrı bir güvenli konumda saklar ve belirteci işleme veya analiz sırasında ikame olarak kullanırsınız. Belirteçlere ayırma, hassas bilgilerin açığa çıkma riskini en aza indirirken veri bütünlüğünün korunmasına yardımcı olur.
Sıfırlama
Sıfırlama (veya karartma), hassas verileri boş değerler veya boş alanlarla değiştiren bir veri maskeleme çözümüdür. Bu, verileri veri kümesinden etkili bir şekilde kaldırır. Bu yaklaşım, verilerin biçimini veya yapısını korumak istediğiniz ancak belirli bilgilerin gizlenmesi gerektiği durumlar için uygundur.
Veri maskelemenin zorlukları nelerdir?
Sonrasında, veri maskeleme konusundaki bazı yaygın zorlukları tartışacağız.
Öznitelik koruma
Veri maskelemenin belirli veri türleri için orijinal veri özniteliklerini koruması, araştırma ve analiz bakımından önemlidir. Veri maskeleme araçlarınızın orijinal veri türlerini veya ilişkili veri kategorilerinin sıklığını koruduğundan emin olmak istersiniz.
Örneğin bir araç, kredi kartı ayrıntılarını gizlerken müşteri verilerinin veya kart kategorisi istatistiklerinin demografik gösterimini değiştirirse bu, analizi etkileyebilir. Öznitelik koruması, rastgeleleştirme veya belirteçlere ayırma gibi belirli veri maskeleme süreçlerinde zorlayıcı hale gelebilir.
Anlamsal bütünlük
Oluşturulan sahte değerler, farklı veri türleriyle ilişkili iş kurallarına ve kısıtlamalarına uymalıdır. Örneğin, maaşlar belirli bir aralığa girmeli ve ulusal kimlik numaraları önceden belirlenmiş bir biçimi takip etmelidir. Anlamsal bütünlüğü korumak zordur ancak maskelenmiş verilerin anlamlı ve gerçekçi kalmasını sağlar.
Veri benzersizliği
Orijinal verilerin çalışan kimlik numaraları gibi benzersizlik gerektirdiği durumlarda, veri maskeleme tekniği orijinal verileri değiştirmek için benzersiz değerler sağlamalıdır. Anahtar alanlarda benzersizliğin olmaması potansiyel çatışmalar veya tutarsızlıklar yaratabilir.
Mevcut iş akışlarıyla entegrasyon
Veri maskelemeyi, özellikle uygulamanın ilk aşamalarında mevcut iş akışlarına entegre etmek zor olabilir. Çalışanlar, yeni süreçlere ve teknolojilere uyum sağlama sürecinde sorun yaşayabilirler. Sorunsuz bir entegrasyon ve minimum kesinti sağlamak için kuruluşunuz dikkatli planlamaya, paydaş iş birliğine ve kullanıcı endişelerini gidermeye odaklanmalıdır.
AWS, veri maskeleme gereksinimlerinizi nasıl destekleyebilir?
Yerleşik veri maskeleme özelliklerine sahip birçok Amazon Web Services (AWS) teklifi vardır. Aşağıda birkaç örnek verilmiştir:
- Amazon Transcribe, konuşmayı otomatik olarak metne dönüştürür ve hassas verileri istendiği gibi maskeleyebilir.
- Amazon Redshift; veri ambarları, operasyonel veritabanları ve veri gölleri genelinde yapılandırılmış ve yarı yapılandırılmış verileri analiz etmek için SQL kullanır. Rol tabanlı erişim denetimi, satır düzeyinde güvenlik, sütun düzeyinde güvenlik ve dinamik veri maskeleme tekniklerini destekler.
- Amazon Basit Bildirim Hizmeti (Amazon SNS) bir bildirim hizmetidir. Bu hizmeti, aktarımdaki hassas verileri keşfedebilen, maskeleyebilen ve koruyabilen veri koruma ilkeleri tanımlamak için kullanabilirsiniz.
Karmaşık veri maskeleme gereksinimleri için mevcut uygulama kılavuzlarımız da mevcuttur. Örneğin, yapay zeka destekli Sağlık Verilerini Maskeleme kılavuzu, sağlık kuruluşlarının görüntü veya metinlerdeki sağlık verilerini tanımlamasına ve maskelemesine yardımcı olur. Bu kılavuz aşağıdaki hizmetleri kullanır:
- Amazon Comprehend Medical bir metin gövdesindeki sağlık verilerini tespit eder
- Amazon Rekognition bir görüntüdeki metni tanımlar
- Amazon API Ağ Geçidi ve AWS Lambda, bu işlev için API arabirimi sağlar
- AWS Kimlik ve Erişim Yönetimi (IAM), API isteklerini yetkilendirir
Ayrıca AWS pazar yerindeki önceden hazırlanmış veri maskeleme çözümlerinden birini seçmeyi de düşünebilirsiniz.
Hemen bir hesap oluşturarak AWS'de veri maskelemeyi kullanmaya başlayın.