Amazon S3 Tabloları

Veri gölünüz ölçeklenirken sorgu performansını ve maliyetini optimize edin

Büyük hacimli tablo biçimindeki verileri S3'te depolayın

Amazon S3 Tabloları, yerleşik Apache Iceberg desteğine sahip ilk bulut nesne depolamasını sunar ve büyük ölçekli tablo biçimindeki verileri depolamayı kolaylaştırır. Sürekli tablo optimizasyonu, arka planda tablo verilerini otomatik olarak tarayıp yeniden yazar. Bu sayede, yönetilmeyen Iceberg tablolarına kıyasla 3 kata kadar daha hızlı sorgu performansı sağlar. Bu performans optimizasyonları zamanla gelişmeye devam edecektir. Ayrıca S3 Tabloları, genel amaçlı S3 bucket'larında depolanan Iceberg tablolarına kıyasla saniyede 10 kata kadar daha fazla işlem sağlayan Iceberg iş yüklerine özel optimizasyonlar içerir. S3 Tabloları'nın sorgu performansı iyileştirmeleri hakkında ayrıntılı bilgi için bloga bakın.

S3 Tabloları'nın Apache Iceberg standardını destekliyor olması sayesinde, tablo biçimindeki verileriniz Amazon Athena, Redshift, EMR ve Apache Spark gibi popüler AWS ve üçüncü taraf sorgu altyapıları ile kolayca sorgulanabilir. Günlük satın alma işlemleri, sensör verisi akışı veya reklam gösterimleri gibi tablo biçimindeki verileri S3'te bir Iceberg tablosu olarak depolamak için S3 Tabloları'nı kullanın ve otomatik tablo bakımından yararlanarak verileriniz değiştikçe performansı ve maliyeti optimize edin. Daha fazla bilgi edinmek için blogu okuyun.

Avantajlar

İster yeni başlıyor ister Iceberg ortamınızda binlerce tabloyu yönetiyor olun, herhangi bir ölçekteki veri göllerini basitleştirin.

Sürekli tablo optimizasyonu sayesinde, yönetilmeyen Iceberg tablolarına kıyasla 3 kata kadar daha hızlı sorgu performansı ve genel amaçlı S3 bucket'larında depolanan Iceberg tablolarına kıyasla saniyede 10 kata kadar daha fazla işlem elde edin.

Zaman içinde sorgu verimliliğini ve maliyetleri otomatik olarak optimize etmek için sıkıştırma, anlık görüntü yönetimi ve referanssız dosya kaldırma gibi sürekli tablo bakım görevlerini gerçekleştirin.

AWS Glue Veri Kataloğu ile S3 Tabloları önizleme entegrasyonu aracılığıyla Amazon Athena, Redshift ve EMR gibi bilindik AWS hizmetlerini kullanarak gelişmiş Iceberg analiz özelliklerine ve sorgulama verilerine erişin. S3 Tablolar, popüler açık kaynak araçlarıyla uyumludur.

Birinci sınıf AWS kaynakları olarak tablolar oluşturun ve bunlara erişimi kolayca yönetmek için izinler uygulayın.

Nasıl çalışır?

S3 Tabloları, yapılandırılmış verilerin Apache Parquet biçiminde depolanması için amaca yönelik S3 depolama alanı sağlar. Doğrudan S3'te bir tablo bucket'ı içinde birinci sınıf kaynaklar olarak tablolar oluşturabilirsiniz. Bu tablolar, kimlik veya kaynak tabanlı politikalarda tanımlanan tablo düzeyinde izinlerle güvence altına alınabilir ve Apache Iceberg standardını destekleyen uygulamalar veya araçlar tarafından erişilebilir. Tablo bucket'ınızda bir tablo oluşturduğunuzda S3'teki temel veriler Parquet verileri olarak depolanır. S3 daha sonra bu Parket verilerini uygulamalarınız tarafından sorgulanabilir hale getirmek için gerekli meta verileri tutar. Tablo bucket'ları, sorgu altyapıları tarafından tablo bucket'ınızdaki tabloların Iceberg meta verilerinde gezinmek ve bunları güncellemek için kullanılan bir istemci kitaplığı içerir. Bu kitaplık, tablo işlemleri için güncellenmiş S3 API'leri ile birlikte, birden fazla istemcinin verileri güvenli bir şekilde okumasına ve tablolarınıza yazmasına olanak tanır. S3 zamanla nesnelerinizi yeniden yazarak veya "sıkıştırarak" temel Parquet verilerini otomatik olarak optimize eder. Sıkıştırma, sorgu performansını iyileştirmek ve maliyetleri en aza indirmek için S3'teki verilerinizi optimize eder. Daha fazla bilgi edinmek için kullanıcı kılavuzunu okuyun

Amazon S3 Tabloları tanıtım videosu

Müşteriler

  • Genesys

    Genesys, Yapay Zeka Destekli Deneyim Düzenleme alanında küresel bir bulut lideridir. Gelişmiş yapay zeka, dijital ve iş gücü etkileşim yönetimi yetenekleri aracılığıyla Genesys, gelişmiş iş çevikliği ve sonuçlarından avantaj sağlarken 100'den fazla ülkede 8.000'den fazla kuruluşa kişiselleştirilmiş, empatik müşteri ve çalışan deneyimleri sunmaları konusunda yardımcı oluyor.

    Amazon S3 Tabloları, çeşitli veri analizi ihtiyaçları için bir gerçekleştirilmiş görünüm katmanını etkili şekilde oluşturan yönetilen Iceberg desteği başta olmak üzere, veri mimarimize dönüştürücü bir katkı sağlayacaktır. Bu teklif, Genesys'in ekstra tablo yönetimi katmanlarını ortadan kaldırarak karmaşık veri iş akışlarını basitleştirmesine yardımcı olma potansiyeline sahiptir ve S3; sıkıştırma, anlık yedek yönetimi ve referanssız dosya temizleme gibi temel bakım görevlerini otomatik olarak ele alır. Iceberg Tablolarını doğrudan S3'ten okuma ve yazma yeteneği, performansı artırmamıza ve verileri analiz ekosistemimizde sorunsuz bir şekilde entegre etmek için yeni olanaklar yaratmamıza yardımcı olacaktır. Performans geliştirmeleriyle birleşen bu birlikte çalışabilirlik; hızlı, esnek ve güvenilir veri öngörüleri sunmak üzere S3 Tabloları'nı gelecekteki stratejimizin önemli bir parçası olarak konumlandırıyor.

    Glenn Nethercutt, Teknoloji Direktörü, Genesys
  • SnapLogic

    SnapLogic, yapay zeka liderliğindeki entegrasyonda öncüdür. SnapLogic Üretken Entegrasyon Platformu, görevleri otomatikleştiren, gerçek zamanlı kararlar veren ve mevcut iş akışlarına zahmetsizce entegre olan yapay zeka temsilcileri ve entegrasyonlar tasarlamak, dağıtmak ve yönetmek üzere kuruluş genelinde dijital dönüşümü hızlandırır.

    Yerleşik Apache Iceberg desteğine ve AWS Analiz hizmetleri entegrasyonuna sahip Amazon S3 Tabloları, şirketlerin veri analizi maliyetlerini optimize etmelerine yardımcı olurken, iş verilerini analiz, uyumluluk ve yapay zeka girişimleri için kullanma biçimlerini dönüştürmelerine yardımcı olur. Karmaşık veri yönetimi görevlerini otomatikleştirerek ve veri değişikliklerinin eksiksiz denetim izlerini sağlayarak, ekipler geçmiş verileri anında analiz edebilir, mevzuata uygunluğu sürdürebilir ve teknoloji maliyetlerini önemli ölçüde azaltırken iş öngörülerini hızlandırabilir.

    Dominic Wellington, Kurumsal Mimar, SnapLogic
  • Zus Health

    Zus; API, gömülü bileşenler ve doğrudan EHR entegrasyonları aracılığıyla kullanımı kolay hasta verileri sağlayarak sağlık verilerinin birlikte çalışabilirliğini hızlandırmak üzere tasarlanmış, paylaşılan bir sağlık verileri platformudur.

    Sık sık değişen hasta verilerini ele alan bir sağlık şirketi olarak Apache Iceberg'e yatırım yapmaya karar verdik çünkü bölümleme ve otomasyon konularında Apache Hive ile ilişkili pek çok sorun noktasını daha kapsamlı bir birlikte çalışabilirlik ek avantajıyla çözümledi. Iceberg ile ilgili en büyük zorluklarımızdan biri tablo optimizasyonunu anlamak ve yönetmek oldu. Bu nedenle S3 Tabloları ve yönetilen optimizasyon yetenekleri konusunda heyecanlıyız. Tablo bakımına ilişkin geliştirici iş yükünü azaltabilmek, müşterilerimize yüksek kaliteli veriler ve değerli öngörüler temin etmeye daha fazla odaklanmamızı sağlayacaktır.

    Sonya Huang, Danışman Yazılım Mühendisi, Zus Health