- Bulut Bilgi İşlem nedir?›
- Bulut Bilgi İşlem Kavramları Merkezi›
- Veri Tabanları
Veri Bütünlüğü nedir?
Veri bütünlüğü nedir?
Veri bütünlüğü, yaşam döngüleri boyunca verilerin doğru, hatasız, tutarlı ve tamamen işlevsel olmasını sağlayarak veri bütünlüğünün korunmasına odaklanır. Tek bir veri deposunda veri bütünlüğünün korunması, erişim taleplerinin sayısına, veri hacmine ve hızına bakılmaksızın yönetilebilir olmalıdır. Modern bulut ortamları, dağıtık veri depoları ile hizmetler arasında karmaşık ve sürekli bir veri hareketi gerektirir. Yüksek aktarım hızlı Çevrimiçi İşlem İşleme (OLTP) sistemleri, sistem tutarlılığını korumak için sıkı veri bütünlüğü denetimleri gerektirir. Veri mühendisleri; entegrasyon, yedekleme ve buluta taşıma da dahil olmak üzere yeni ve mevcut veri depoları ile süreçlerde veri bütünlüğü denetimleri uygulamalıdır. Bu makalede bulutta veri bütünlüğü yönetimine yönelik zorluklar ve çözümler incelenmektedir.
Veri bütünlüğü, yaşam döngüleri boyunca verilerin doğruluğunu, tutarlılığını ve eksiksizliğini koruma sürecidir. Veri kalitesinin güvence altına alınmasının önemli bir parçası olan bu süreç, bir kuruluşun verilerinin işlem işleme, iş zekası ve analiz için uygun ve güvenilir olmasını sağlar. Veri bütünlüğü, hassas bilgileri yetkisiz erişime karşı korurken verileri doğrulamaya yönelik çeşitli yöntem ve protokolleri kapsar.
Veri bütünlüğü neden önemlidir? Veri bütünlüğü, bir kuruluşun finansal faaliyetleri ile diğer iş faaliyetlerinin kaydedilmesinde ve karar verme süreçlerinde o kuruluşun verilerinin güvenilirliğini sağlar. Veri bütünlüğü, verileri ve bunların dönüşümlerini işleyen araçlar ve roller ne olursa olsun çok önemlidir.
Veri bütünlüğü, ticari işlemlerin doğru işlenmesini ve finansal operasyonlarda tutarlılığı sağladığı, ayrıca yinelenen kayıt veya işlem kaybı gibi sorunları önlediği için Çevrimiçi İşlem İşleme (OLTP) sistemlerinde kritik öneme sahiptir. Veri bütünlüğündeki aksaklıklar, mevzuata uygun olmama ve müşteri memnuniyetinde azalma gibi sonuçlara yol açabilir.
Veri bütünlüğünü korumada karşılaşılan zorluklar nelerdir?
Bir kuruluş içinde veri bütünlüğünü sağlamak, insan ve teknolojiyle ilgili veri yönetimi zorluklarının ele alınmasını gerektirir.
OLTP ortamları
OLTP ortamlarında veri bütünlüğüyle ilgili en büyük zorluk, özellikle yüksek hacimli işlemler esnasında veri tutarlılığını korurken eş zamanlı işlemleri yönetebilmektir. Bu zorluk; sıkı Bölünmezlik, Tutarlılık, Yalıtım ve Dayanıklılık (ACID) uygunluğu ile performans gereksinimleri arasında bir denge kurulmasını gerektirir. Burada birden fazla kullanıcı, sistemin gerçek zamanlı işleme yeteneklerini korurken yarış koşulları ve kilitlenmelerle karşılaşmadan aynı verileri eş zamanlı olarak değiştirebilmelidir.
İş zekası ve analiz
İş zekası ve analize ilişkin kullanım örneklerinde, veri kaynakları ve sistemler arasındaki sınırlı entegrasyon, şirketlerin veri varlıklarına ilişkin birleşik ve doğru bir görünüm elde etmesini engeller. Ayrıca manuel olarak yapılan veri girişi ve veri toplama işlemlerine güvenmek, veri doğruluğunu tehlikeye atan yazım hatalarına, eksikliklere ve tutarsızlıklara yol açabilir.
Denetim ve veri izleri
Diğer bir zorluk ise uygun denetim izlerinin bulunmamasıdır; bu da verilerin, toplanmalarından silinmelerine kadar olan geçmişlerini takip etmeyi zorlaştırır. Kuruluşlar, yetkisiz veri değişikliklerine ilişkin görünürlüğü kaybetme riskiyle karşı karşıya kalır. Güncel olmayan dosya biçimleri kullanan veya temel doğrulama işlevlerine sahip olmayan eski sistemler, veri bütünlüğünü daha da karmaşıklaştırır. Verileri buluta taşımak, daha merkezi veri kalitesi mekanizmalarının uygulanmasına olanak tanır ve veri bütünlüğü denetimleri için gereken zamanı ve çabayı azaltır.
Veriler, bulutta nasıl korunur?
Veri bütünlüğü, genel olarak iki türe ayrılabilir.
Fiziksel bütünlük
Fiziksel bütünlük süreçleri; verileri doğal afetler, elektrik kesintileri, donanım arızaları veya fiziksel depolama aygıtlarını etkileyen diğer faktörlerin neden olduğu hasar ve bozulmaya karşı korur. Bulutta fiziksel bütünlük, bulut sağlayıcısı tarafından otomatik olarak yönetilir. Bu, Paylaşılan Sorumluluk Modeli kapsamında bulut sağlayıcısının sorumluluğundadır.
Örneğin AWS veri merkezleri, verilerinizi depolayan fiziksel cihazlara dört katmanlı bir veri güvenliği altyapısı sağlar. Veri güvenliği özellikleri şunları içerir:
- Çok faktörlü kimlik doğrulama ve elektronik denetimlerle güvenliği sağlanan sunucu odası erişimi sayesinde sıkı erişim denetimleri.
- Otomatik yetkisiz veri silme algılama gibi saldırı önleme tedbirleri.
- Kurulum ve tedarik aşamalarından kaldırma ve hizmet dışı bırakma aşamalarına kadar güvenli depolama cihazı yönetimi.
- Ekipman denetimleri de dahil olmak üzere 2.600'den fazla güvenlik gereksinimine yönelik titiz üçüncü taraf denetimleri.
Mantıksal bütünlük
Mantıksal bütünlük süreçleri, verilerin, içinde bulundukları depolama sisteminin temel kurallarını karşılamasını sağlar. Mantıksal bütünlük ayrıca dört alt türe ayrılabilir:
- Etki alanı bütünlüğü, değerleri belirli bir aralık, biçim veya önceden tanımlanmış bir küme (örneğin veri türleri ve diğer benzeri veri kısıtlamaları) ile kısıtlayarak veri doğruluğunu sağlar.
- Varlık bütünlüğü, birincil anahtar gibi mekanizmalar aracılığıyla bağımsız veri kayıtlarının benzersiz şekilde tanımlanabilmesini sağlayarak anahtar alanlarda, yinelenen veya boş değerler olmasını önler.
- Referans bütünlüğü, yalıtılmış veri kayıtlarını önlemek için yabancı anahtar kısıtlamalarını zorunlu kılarak tablolar arasında tutarlı ilişkiler sağlar.
- Kullanıcı tanımlı bütünlük, standart kısıtlamaların ötesinde özel doğrulama mantığı veya uygulama düzeyinde zorlama gibi işletmeye özgü kuralları uygular.
Mantıksal bütünlük kısıtlamalarını uygulayıp veri kalitesini sağlamaktan bulut kullanıcısı sorumludur. Bu, Paylaşılan Sorumluluk Modeli kapsamında müşterinin sorumluluğundadır.
Bununla birlikte AWS veri hizmetleri, veri bütünlüğü denetimini desteklemeye yönelik çeşitli mekanizmalar sunar. Bunlar arasında sağlama toplamı algoritmaları, veri kalitesi izleme araçları ve hem yedeklemeler hem de veri senkronizasyonu esnasında gerçekleştirilen otomatik veri bütünlüğü denetimleri bulunur.
Yönetilen hizmetler, veri bütünlüğünüz için otomatik ve yapılandırılabilir bütünlük korumaları sağlayabilir. OLTP sistemleri ve veri tabanları içinde mantıksal bütünlük süreçleri; her bir işlemin Bölünmez, Tutarlı, Yalıtılmış ve Dayanıklı (ACID) kalmasına yardımcı olur.
Bulutta veri bütünlüğü nasıl sağlanır?
AWS bulutunda mantıksal bütünlüğü uygulamak için aşağıdaki önlemleri almayı düşünün.
Nesne verisi bütünlüğünü uygulama
Çoğu bulut veri işlemi, herhangi bir veri türünü nesne olarak depolayabilen Amazon S3 bucket'ları ile başlar. Amazon S3 bucket'ları, veri tabanları, diğer bulut hizmetleri ve şirket içi depolama arasında sık sık veri taşıyabilirsiniz. Amazon S3; yükleme, indirme ve kopyalama sırasında veri bütünlüğü risklerini azaltmak için yerleşik sağlama toplamı mekanizmaları sağlar.
Sağlama toplamı, belirli bir algoritma kullanılarak verilerden üretilen benzersiz, sabit uzunlukta bir değerdir. Benzersiz bir dijital parmak izi oluşturarak sistemlerin veri bozulmasını veya istenmeyen değişiklikleri algılamasını sağlar. Nesneleri kopyalarken Amazon S3, kaynak nesnenin sağlama toplamını hesaplar ve bunu hedef nesneye uygular. Bir uyuşmazlık durumunda uyarı verir. Amazon S3, çok parçalı yüklemeler için hem tam nesne hem de bileşik sağlama toplamlarını destekler. Tam nesne sağlama toplamları, dosyanın tamamını kapsarken bileşik sağlama toplamları, tek tek parça düzeyindeki sağlama toplamlarını bir araya getirir.
Sağlama toplamı işlevini aşağıda açıklandığı şekilde kullanın.
Yüklemeler
Amazon S3, CRC-64/NVME, CRC-32, CRC-32C, SHA-1 ve SHA-256 gibi çeşitli Güvenli Karma Algoritmaları (SHA) ve Döngüsel Artıklık Denetimi (CRC) algoritmalarını destekler. AWS Yönetim Konsolu'nu kullanıyorsanız yükleme esnasında sağlama toplamı algoritmasını seçin. Hiçbir sağlama toplamı belirtilmezse Amazon S3, varsayılan olarak CRC-64/NVME'yi kullanır.
İndirmeler
Nesneleri indirirken, veri bütünlüğünü doğrulamak için, depolanan sağlama toplamı değerini talep edin. Yüklemenin tamamlanıp tamamlanmadığına veya hâlâ devam edip etmediğine bağlı olarak GetObject, HeadObject veya ListParts işlemlerini kullanarak sağlama toplamı değerlerini alın.
Kopyalama
Bir nesne CopyObject işlemi kullanılarak kopyalanırsa Amazon S3, nesnenin tamamı için doğrudan bir sağlama toplamı oluşturur. Nesne başlangıçta çok parçalı yükleme olarak yüklendiyse veriler değişmeden kalsa bile kopyalandıktan sonra sağlama toplamı değeri değişir.
Veri işlem hattı bütünlüğünü uygulama
Diğer bir yaygın kullanım örneği, verileri bulut veri göllerine, veri ambarlarına veya yönetilen veri tabanı hizmetlerine taşımaktır. Bu tür veri işlem hatlarında veri bütünlüğü denetimlerini ayarlamak hataya açık, sıkıcı ve zaman alıcı bir iştir. Veri kalitesi bozulduğunda veri tüketicilerini uyaran izleme kodunu ve veri kalitesi kurallarını manuel olarak yazmanız gerekir.
Taşıma süreci
AWS Veri Tabanı Taşıma Hizmeti (DMS), birden fazla yerleşik koruma ve doğrulama mekanizması aracılığıyla AWS Bulut veri tabanlarına taşıma işlemleri esnasında veri bütünlüğünü korur. DMS, kaynak ve hedef verileri karşılaştırmak için otomatik doğrulama gerçekleştirir ve veri yeniden senkronizasyonu yoluyla uyuşmazlıkları belirleyip giderir.
DMS, kesinti olduğunda taşımaların bilinen son iyi durumdan itibaren devam etmesini sağlayan denetim noktası ve kurtarma özellikleri içermesinin yanında taşıma ilerlemesini izlemek için de kapsamlı izleme ve günlük kaydı özellikleri sunar. Ayrıca DMS, taşınan veriler için SSL şifrelemesi ve AWS güvenlik hizmetleriyle entegrasyon yoluyla veri güvenliği sağlar.
Veri tabanı altyapısı
AWS veri tabanları, veri dayanıklılığı ve tutarlılığını sağlayan otomatik yedeklemeler ve Multi-AZ dağıtımları da dahil olmak üzere çok sayıda kapsamlı mekanizma ve özellik aracılığıyla veri bütünlüğünü korur. Bu veri tabanları, yerleşik kısıtlamalar aracılığıyla referans bütünlüğünü sağlar, işlemsel tutarlılık için ACID uyumluluğunu korur ve zaman içinde nokta kurtarma özellikleri sunar. Amazon Relational Database Service (RDS) ve Amazon Aurora gibi yönetilen veri tabanı hizmetleri, veri bütünlüğü için belirli denetimler ayarlamanıza olanak tanır. Örneğin Aurora, OLTP veri tabanınızda farklı işlem yalıtım düzeyleri ayarlamanızı sağlar.
Gelişmiş koruma sağlamak için AWS veri tabanları, coğrafi olarak dağıtık bölgeler genelinde verileri çoğaltarak çok bölgeli dağıtımlar aracılığıyla olağanüstü durum kurtarmayı destekler. Amazon CloudWatch ile entegrasyon, olası veri bütünlüğü sorunlarının operasyonları etkilemeden önce belirlenip giderilmesine yardımcı olur.
Veri entegrasyonu
AWS Glue, AWS bulutundaki verileri hazırlamak ve birleştirmek için kullanılan sunucusuz bir veri entegrasyonu hizmetidir. AWS Glue Veri Kalitesi özelliği, manuel veri doğrulama çalışmalarının süresini günlerden saatlere indirir. Otomatik olarak kalite kuralları önerir, istatistikleri hesaplar ve yanlış veya eksik veriler algıladığında sizi uyarır. Veri bütünlüğü kurallarını tanımlamak için kullandığınız, alana özgü bir dil olan Veri Kalitesi Tanımlama Dili (DQDL) ile çalışır.
OLTP sistemlerinden analizlerde kullanmak üzere veri toplarken AWS Glue işlem hatlarını kullanarak veri tabanlarınızdaki verileri analiz hizmetlerine gönderebilirsiniz.
Ölçümleri ayrıca, izleme ve uyarı amacıyla Amazon CloudWatch'ta da yayınlayabilirsiniz.
Veri yedekleme bütünlüğünü uygulama
Büyük kurumsal projelerde, farklı konumlardan veri yedeklemeleri yapan ve Amazon S3 depolarına erişen çeşitli ekipler olabilir. Veri yönetişimi, bu tür dağıtık veri yedekleme operasyonlarında bir zorluk haline gelir. AWS veri tabanlarının yerleşik yedekleme özellikleriyle birlikte sunulduğunu unutmayın.
AWS Backup; Amazon Simple Storage Service (S3), Amazon Elastic Compute Cloud (EC2), Amazon FSx gibi AWS hizmetleri ve VMware'deki hibrit iş yükleri genelinde veri korumasını merkezileştiren ve otomatikleştiren, tam olarak yönetilen bir hizmettir. AWS kaynakları ve hesapları genelinde yedekleme faaliyetlerinizi yönetmek, düzenlemek ve yapılandırmak için veri koruma politikalarını merkezi olarak dağıtabilirsiniz.
AWS Backup, verilerin aktarımı ve depolanmasından işlenmesine kadar tüm veri yaşam döngüsü boyunca veri bütünlüğünü korumak için tasarlanmıştır. Türü ne olursa olsun, depolanan tüm verilere sıkı güvenlik önlemleri uygular ve yetkisiz veri erişimine karşı yüksek düzeyde koruma sağlar. Veri sınıflandırması, depolama konumları ve güvenlik politikaları üzerinde tam kontrole sahip olursunuz. Böylece verileri kendi ihtiyaçlarınıza göre yönetebilir, arşivleyebilir ve koruyabilirsiniz.
AWS Backup, veri bütünlüğünü korumak için birden fazla mekanizma kullanarak diğer AWS hizmetleriyle iş birliği yapar. Bu mekanizmalar şunları içerir:
- Bozulmayı önlemek için sürekli sağlama toplamı doğrulaması.
- Taşınan ve bekleyen verilerdeki bütünlüğü doğrulamak için dahili sağlama toplamları.
- Disk arızaları durumunda otomatik yedeklilik geri yüklemesi.
Veriler birden fazla fiziksel konumda yedekli olarak depolanır ve ağ düzeyinde yapılan denetimler de veri aktarımları esnasında gerçekleşen bozulmaları tespit etmeye yardımcı olur.
AWS, veri bütünlüğünün korunmasına nasıl yardımcı olabilir?
Veri bütünlüğü analizlere duyulan güveni artırır, uygunluğu destekler ve yaşam döngüleri boyunca verilerin değerli kalmasını sağlar. Ancak şirket içi dağıtımlarda veri bütünlüğünü sağlamak zorlu ve maliyetlidir. Bu süreç; manuel, dağıtık ve yinelenen işler nedeniyle saatlerce süren kayıplara neden olabilir.
Bulut teknolojileri, süreci merkezileştirir ve zorlu işlerin büyük bir kısmını sizin yerinize üstlenir. Çeşitli fiziksel ve mantıksal bütünlük denetimleri varsayılan olarak yerleşiktir. Otomasyon mekanizmaları, veri bütünlüğünü sağlamak için gereken yazılım kurallarını kendiliğinden oluşturur. Veri mühendislerinin yalnızca ayarları yapılandırması veya otomatik mekanizmalar tarafından yapılan işi gözden geçirmesi gerekir. Veri bütünlüğü, OLTP sistemlerinin yüksek hacimli ve gerçek zamanlı işlemleri gerçekleştirirken mükemmel doğruluğu korumasını sağlar ki bu da güvenilir iş operasyonları ve uygulamaları için kritik öneme sahiptir.
Hemen ücretsiz bir bulut hesabı oluşturarak kullanmaya başlayın.