Amazon S3 テーブルの発表 — 分析ワークロード向けに最適化されたフルマネージド型の Apache Iceberg テーブル

投稿日: 2024年12月3日

Amazon S3 Tables は、Apache Iceberg サポートが組み込まれた初めてのクラウドオブジェクトストアであり、表形式のデータを大規模に保存する最も簡単な方法でもあります。S3 テーブルは分析ワークロード専用に最適化されているため、セルフマネージドテーブルと比較して、クエリのスループットが最大 3 倍速く、1 秒あたりのトランザクション数が最大 10 倍多くなります。S3 テーブルは Apache Iceberg 標準をサポートしているため、一般的な AWS やサードパーティのクエリエンジンで表形式のデータを簡単にクエリできます。さらに、S3 テーブルは、データレイクが拡大し進化しても、継続的にテーブルメンテナンスを実行して、クエリ効率とストレージコストを時間の経過とともに自動的に最適化するように設計されています。 S3 テーブルと AWS Glue データカタログの統合はプレビュー段階にあり、Amazon Data Firehose、Athena、Redshift、EMR、QuickSight などの AWS Analytics サービスを使用して、S3 メタデータテーブルを含むデータのストリーミング、クエリ、および可視化を行うことができます。

S3 テーブルでは、テーブルバケットが導入されました。テーブルバケットは、表形式のデータを格納するための新しいバケットタイプです。テーブルバケットを使用すると、テーブルをすばやく作成し、テーブルレベルの権限を設定してデータレイクへのアクセスを管理できます。その後、標準 SQL を使用してテーブルにデータをロードしてクエリし、行レベルのトランザクション、クエリ可能なスナップショット、スキーマの進化などの Apache Iceberg の高度な分析機能を活用できます。テーブルバケットはポリシー主導型のテーブルメンテナンスも提供するため、コンパクション、スナップショット管理、未参照ファイルの削除などの運用タスクを自動化できます。

Amazon S3 テーブルは現在、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン) の各リージョンでご利用いただけます。また、まもなく他のリージョンでもご利用いただけるようになります。 料金の詳細については、S3 の料金ページをご覧ください。詳細については、製品ページドキュメント、および AWS ニュースブログをご覧ください。