Amazon SageMaker Veri İşleme

Her ölçekte analiz ve yapay zeka için verileri analiz edin, hazırlayın ve entegre edin

Neden SageMaker Veri İşleme?

Amazon Athena, Amazon EMR, AWS Glue ve Apache Airflow İçin Amazon Yönetilen İş Akışları'nın (Amazon MWAA) veri işleme özellikleriyle verilerinizi hazırlayın, entegre edin ve düzenleyin. Yüzlerce veri kaynağına hızlı ve kolay bağlantı ile verilerinizi, nerede olursa olsunlar, işleyin ve entegre edin.

Apache Spark, Trino ve Apache Flink gibi açık kaynaklı veri işleme çerçevelerini kullanın. Altyapıyı yönetmeden Trino ile verileri uygun ölçekte analiz edin, Apache Flink ve Apache Spark ile sorunsuz bir şekilde gerçek zamanlı analiz oluşturun.

Veri kalitesi sağlama, hassas verileri tanımlama ve köken takibi süreçlerini otomatikleştirerek ve Amazon SageMaker Lakehouse ile yerel entegrasyon yoluyla ayrıntılı erişim denetimleri uygulayarak verilerinizin doğruluğunu ve güvenliğini güvence altına alın.

Avantajlar

AWS hizmetleri

Basitleştirilmiş veri entegrasyonu

AWS Glue, birden çok kaynaktan veri keşfi, hazırlama ve entegrasyonu basitleştiren sunucusuz veri entegrasyonu sağlar. Çeşitli veri kaynaklarına bağlanın, verilerinizi merkezi bir veri kataloğunda yönetin ve göl evinize veri yüklemek için ETL işlem hatlarını görsel olarak oluşturun, çalıştırın ve izleyin. AWS Glue istek üzerine otomatik olarak ölçeklenir. Böylece altyapı yönetmenize gerek kalmadan verilerinizden öngörüler elde etmeye odaklanabilirsiniz.

Apache Spark, Apache Hive, Trino ve diğer iş yüklerini çalıştırın ve ölçeklendirin

Amazon EMR; Apache Spark, Apache Airflow, Apache Flink ve Trino gibi veri işleme iş yüklerini çalıştırmayı daha kolay ve daha uygun maliyetli hale getirir. Veri işleme işlem hatları oluşturup çalıştırın ve şirket içi çözümlere kıyasla otomatik olarak daha hızlı ölçeklendirin.

Maliyetleri takip edin

Amazon Athena, verilerinizi herhangi bir ölçekte analiz etmek için basitleştirilmiş ve esnek bir yol sunar. Athena, standart SQL kullanarak Amazon S3'te veri analizini basitleştiren etkileşimli bir sorgu hizmetidir. Athena, sunucusuzdur. Dolayısıyla, kurulacak veya yönetilecek bir altyapı yoktur ve çalıştırdığınız sorgulara veya sorgularınızın ihtiyaç duyduğu işlem kaynaklarına göre ödeme yapmayı seçebilirsiniz. Günlükleri işlemek, veri analizi gerçekleştirmek ve etkileşimli sorgular çalıştırmak için Athena'yı kullanın. Athena, sorguları paralel olarak yürüterek otomatik olarak ölçeklenir. Bu sayede, büyük veri kümeleri ve karmaşık sorgularla bile hızlı sonuçlar elde edilebilir.

Apache Airflow için güvenlik odaklı ve yüksek oranda erişilebilir, yönetilen iş akışı düzenlemesi

Amazon MWAA, iş akışlarınızı düzenlemek için aşina olduğunuz mevcut Apache Airflow platformunuzu kullanmanıza olanak tanıyan, Apache Airflow için yönetilen bir hizmettir. Temel altyapıyı yönetmenin operasyonel yükü olmadan geliştirilmiş ölçeklenebilirlik, erişilebilirlik ve güvenlik elde edersiniz. Amazon MWAA, Python dilinde yazılmış yönlendirilmiş döngüsel olmayan grafikleri (DAG'ler) kullanarak iş akışlarınızı düzenler. Amazon MWAA'ya DAG'lerinizin, eklentilerinizin ve Python gereksinimlerinizin bulunduğu bir S3 bucket'ı sağlarsınız. Temel altyapıyı yönetmeyle ilgili operasyonel yük olmadan Apache Airflow'u uygun ölçekte dağıtın.

Kullanım örnekleri