AWS'de Modern Veri Mimarisi
Modern veri mimarisi - Tüm bunlar nasıl çalışır?
Modern bir veri mimarisi, analizlerde herkese uyan tek bir yaklaşım benimsemenin uzlaşmayla sonuçlandığını gösterir. Bu, yalnızca bir data lake'i bir veri ambarıyla entegre etmekle ilgili değil, daha çok bir data lake'i, bir veri ambarını ve amaca özel tasarlanmış depoları entegre ederek birleşik bir yönetişim ve veriler için kolay taşınabilirlik sağlamakla ilgilidir. Müşteriler, AWS'de modern bir veri mimarisi sayesinde ölçeklenebilir data lake'leri hızla oluşturabilir; amaca özel tasarlanmış veri hizmetlerinden oluşan geniş ve derin bir koleksiyondan yararlanabilir; birleşik bir veri erişimi, güvenlik ve yönetişim aracılığıyla uygunluk sağlayabilir; performanstan ödün vermeden sistemlerini düşük bir maliyetle ölçeklendirebilir; verileri kurumsal sınırlar dahilinde kolayca paylaşabilir ve böylece uygun ölçekte hızlı ve çevik bir şekilde karar alabilirler.

Neden modern bir veri mimarisine ihtiyacınız var?
Veri hacimleri, benzeri görülmemiş bir hızla terabaytlardan petabaytlara ve bazen de eksabaytlara kadar çıkıyor. Şirket içi geleneksel veri analizi yaklaşımları, yeterince iyi ölçeklenmediğinden ve çok pahalı olduğundan bu veri hacimlerini işleyemez. Pek çok şirket, farklı silolardaki tüm verilerini alıyor ve doğrudan bu veriler üzerinde analiz ve ML çalışmaları gerçekleştirmek için onları çoğu kişinin bir data lake olarak adlandırdığı tek bir konumda topluyor. Bu şirketler başka zamanlarda, hem yapılandırılmış hem de yapılandırılmamış verileri analiz etmek ve hızlı öngörüler edinmek için diğer verileri amaca özel tasarlanmış veri depolarında saklıyor. Veriler, çekime sahip olduğundan bu veri hareketi "içten dışa", "dıştan içe", "sınır çevresinde" veya "paylaşımlı" olabilir.
-
İçten dışa
-
Dıştan içe
-
Sınır çevresinde
-
Paylaşımlı
-
Veri çekimi
-
İçten dışa
-
İçten dışa veri taşıma
Müşteriler, verileri bir data lake'te depoluyor ve ardından ek makine öğrenimi veya analiz için bu verilerin bir kısmını amaca özel tasarlanmış bir veri deposuna taşıyor.
Örnek: Web uygulamalarındaki tıklama akışı verileri, doğrudan bir data lake'te toplanabilir ve bu verilerin bir kısmı, günlük raporlama için bir veri ambarına taşınabilir. Bu kavramı, içten dışa veri taşıma olarak ele alıyoruz.
-
Dıştan içe
-
Dıştan içe veri taşıma
Müşteriler, verileri bir veri ambarı veya veritabanı gibi amaca özel tasarlanmış veri depolarında saklıyor ve bu verileri, üzerinde analiz yapmak için bir data lake'e taşıyor.
Örnek: Makine öğrenimini kullanarak daha büyük bir veri kümesinde ürün tavsiyesi algoritmaları çalıştırmak için belirli bir bölgedeki ürünlerin satışına ilişkin sorgu sonuçlarını veri ambarlarından data lake'lerine kopyalarlar.
-
Sınır çevresinde
-
Sınır çevresinde veri taşıma
Data lake'inizi, veri ambarınızı ve amaca özel tasarlanmış veri depolarınızı sorunsuz bir şekilde entegre edin.
Örnek: Ürün kataloglarını incelemeyi ve veritabanlarındaki arama sorgusu yükünü boşaltmayı kolaylaştırmak için veritabanlarında depolanan ürün kataloğu verilerini arama hizmetlerine kopyalayabilirler.
-
Paylaşımlı
-
Paylaşımlı veri taşıma
Müşteriler, iş kollarıyla uyumlu veri etki alanları oluşturmak için mantıksal veya fiziksel yönetişim sınırları boyunca yönetişim ve veri paylaşımını kolaylaştırmak üzere modern bir veri mimarisi kullanıyor
-
Veri çekimi
-
Veri çekimi
Bu data lake'lerdeki ve amaca özel tasarlanmış depolardaki veriler artmaya devam ettikçe, çekimden dolayı tüm bu verileri taşımak daha zor bir hal alır. Analiz gerçekleştirmek ve öngörü elde etmek için verilerin ihtiyaç duyulan yere, doğru denetimlerle kolayca ulaşmasını sağlamak da eşit derecede önemlidir.
Modern veri mimarisi bileşenleri
Kuruluşlar, farklı silolardaki verilerini alıyor ve bu veriler üzerinde analiz ve makine öğrenimi çalışmaları gerçekleştirmek için onları tek bir konumda topluyor. En yüksek değeri elde etmek için, verilerini data lake'ler ve amaca özel tasarlanmış veri depoları arasında kolayca taşımak üzere modern bir veri mimarisinden yararlanmaları gerekiyor. Bu modern mimari yöntemi şunları gerektirir:
-
Ölçeklenebilir data lake'ler
On binlerce müşteri, data lake'lerini AWS'de çalıştırmaktadır.
Ancak günümüzde data lake kurmak ve yönetmek için çok sayıda manuel ve zaman alan işi üstlenmek gerekir. Data lake'inizi birkaç ay yerine sadece birkaç günde oluşturabilmeniz ve güvene alabilmeniz için AWS Lake Formation bu görevleri otomatikleştirir. Data lake depolama alanınız için en uygun yer, dayanıklılık oranındaki dokuzların sayısı 11'i bulan; %99,99 erişilebilirlik sağlayan; nesne seviyesinde denetim günlüğü tutma ve erişim denetimi ile en iyi güvenliği, uygunluğu ve denetim kabiliyetlerini sunan; beş depolama katmanı ile en yüksek esnekliği sağlayan ve TB başına aylık 1 USD'den düşük fiyatlandırmayla en düşük maliyete sahip olan Amazon S3'tür.
-
Amaca özel tasarlanmış analiz hizmetleri
AWS, benzersiz analiz kullanım örnekleriniz için optimize edilmiş en geniş, en derin ve amaca özel tasarlanmış analiz hizmetlerini sunar.
Tümü sınıfının en iyisi olmak üzere tasarlanmış bu hizmetlerde performanstan, ölçekten veya maliyetten ödün vermeniz gerekmez. Örneğin Amazon Redshift, diğer tüm bulut veri ambarlarından 3 kat daha hızlı ve en az yüzde 50 daha ucuzdur. Amazon EMR'de Spark, standart Apache Spark 3.0'dan 1,7 kat daha hızlı çalışır ve geleneksel şirket içi çözümlerin maliyetinin yarısından azına petabayt ölçeğinde analizler çalıştırmanıza imkan tanır.
-
Birleşik veri erişimi
Data lake'lerinizdeki ve amaca özel tasarlanmış veri depolarınızdaki veri miktarı artmaya devam ettikçe, bu verilerden bir kısmını bir veri deposundan bir başkasına sıklıkla taşımanız gerekecektir.
AWS, verilerinizi birden fazla veri deposu arasında ve data lake'iniz içerisinde birleştirmenizi, taşımanızı ve çoğaltmanızı kolaylaştırır. Örneğin AWS Glue; analiz, makine öğrenimi ve uygulama geliştirme amacıyla verileri keşfetmenizi, hazırlamanızı ve birleştirmenizi kolaylaştıran kapsamlı veri entegrasyonu kabiliyetleri sağlar. Amazon Redshift ise S3 data lake'inizdeki verileri kolayca sorgulamanıza olanak tanır. Verilerinizi en çok ihtiyaç duyduğunuz yere uygun ölçekte taşımanızı bu kadar kolaylaştırabilen başka hiçbir analiz sağlayıcısı yoktur.
-
Birleşik yönetişim
Modern bir analiz mimarisinin en önemli bileşenlerinden biri, müşterilerin verilere erişimi yetkilendirebilmesi, yönetebilmesi ve denetleyebilmesidir.
Kuruluşunuzun tüm veri depolarındaki güvenliği, erişim denetimini ve denetim izlerini yönetmek karmaşık, zaman alan ve hatalara açık bir iş olduğundan, bu son derece zorlayıcı bir görev olabilir. AWS, data lake'inizdeki ve amaca özel tasarlanmış veri depolarınızdaki tüm verilerinize erişimi tek bir yerden yönetmeniz için size yönetişim becerisi sunar. AWS Lake Formation; güvenlik, yönetişim ve denetleme ilkelerini merkezi olarak tanımlamanıza ve yönetmenize olanak tanır ve böylece, kurumsal çapta veri paylaşımı için tek tip erişim denetimi sunar.
-
Yüksek performanslı ve uygun maliyetli
AWS olarak tüm analiz hizmetlerinde en iyi performansı en düşük maliyetle sağlamaya kararlıyız ve hizmetlerimizin fiyat/performans oranını iyileştirmek için sürekli olarak inovasyon yapıyoruz.
Analiz hizmetleri için sektör lideri fiyat/performans oranına ek olarak S3 Intelligent Tiering, müşterilerin data lake'lerinde depolanan verilerin depolama maliyetinde yüzde 70'e varan oranda tasarruf etmesini sağlar. Amazon EC2 ise 200'den fazla bulut sunucusu tipi arasından seçim yapma, 100 Gbps'ye varan ağ bant genişliğinden yararlanma ve istek üzerine, rezerve edilmiş ve spot bulut sunucuları arasından en uygun olanı kullanma imkanı sunar.
Diğer hizmetlere kıyasla, daha fazla müşteri AWS'de modern veri mimarisinden yararlanıyor
-
BMW Group
-
BMW Group, inovasyonu hızlandırmak ve veri kullanımını uygun ölçekte demokratikleştirmek için şirket içi data lake'ini Amazon S3 tarafından desteklenen bir data lake'e taşıdı ve şimdi, her gün milyonlarca araçtan terabaytlarca telemetri verisini işliyor ve sorunları müşteriler etkilenmeden çözüyor.
-
Nielsen
-
Küresel bir ölçüm ve veri analizi şirketi olan Nielsen, modern bir bulut teknolojisinden yararlanarak her gün alabileceği, işleyebileceği ve müşterilerine raporlayabileceği veri miktarını önemli ölçüde artırdı. Günlük 40.000 hanede ölçüm yaparken, şimdi bu sayı 30 milyonu aştı.
-
Engie
-
ENGIE, 160.000 çalışanı ve 70 ülkede faaliyet gösteren 40 iş birimiyle Fransa'nın en büyük kamu hizmetleri şirketlerinden biridir. Ortak Veri Merkezi’nin yaklaşık 100 TB boyutundaki data lake'i; veri bilimi, pazarlama ve operasyonlardaki iş ihtiyaçlarını karşılamak için AWS hizmetlerini kullanıyor.
Çözüm Ortakları
Çözüm ortaklarımızın, kuruluşların AWS'de modern bir veri mimarisi oluşturmasına nasıl yardımcı olduğunu öğrenin.

Cloudera
Cloudera Enterprise'ı AWS üzerinde çalıştırmak, BT ve iş kullanıcılarına modern veri işleme ve analiz için temel oluşturabilecek veri yönetimi platformu sağlamaktadır.
/Informatica_icon_solutionspace.b413aef928d0d5cb73d65ffe147b99059a187b46.png)
Informatica Cloud
Informatica Cloud, sayısı 100'ü aşan uygulamaya yerel bağlantı sağlayan AWS veri hizmetlerine, optimize entegrasyon sağlamaktadır.

Dataguise
Dataguise, güvenli iş yürütme konusunda liderdir ve nerede depolandığına veya kimin kullanması gerektiğine bakılmaksızın, işletmenin hassas verilerini tespit eden ve koruyan veri merkezli güvenlik çözümleri sunar.

Alluxio Data Orchestration
Alluxio Data Orchestration, kullanıcıların analiz ve yapay zeka iş yükleri için EMR ve S3 gibi AWS hizmetlerinden daha iyi yararlanmasını sağlar.
Kullanmaya başlama

AWS Data-Driven Everything
AWS, AWS Data-Driven EVERYTHING (D2E) programında müşterilerimizle iş birliği içinde çalışarak daha hassas şekilde ve çok daha iddialı bir kapsamda daha hızlı hareket etmenizi ve böylelikle kendi veri çarkınızı hızlı bir biçimde çalıştırmanızı sağlayacaktır.
Daha fazla bilgi edinin »

AWS Data Lab
AWS Data Lab, veri ve analiz modernizasyonu girişimlerini hızlandıran somut sonuçlar ortaya koymak amacıyla müşteriler ile AWS teknik kaynakları arasında hızlandırılmış ve ortak mühendislik çalışmaları sunar.

AWS analiz ve büyük veri referans mimarisi
AWS'de bulut verileri analizi, veri ambarı ve veri yönetimine yönelik en iyi mimari uygulamaları hakkında daha fazla bilgi edinin.