AWS Glue データカタログが Amazon VPC からの Apache Iceberg テーブルの自動最適化をサポート

投稿日: 2024年11月21日

AWS Glue データカタログが、特定の Amazon 仮想プライベートクラウド (VPC) 環境からのみアクセス可能な Apache Iceberg テーブルの自動最適化をサポートするようになりました。お客様は VPC 設定を指定して自動最適化を有効にすることで、テーブルを安全に保ちながらストレージを最適化し、クエリのパフォーマンスを向上させることができます。

AWS Glue データカタログは、圧縮、スナップショット保持、参照されていないファイルの管理をサポートしているため、メタデータのオーバーヘッドの削減、ストレージコストの管理、クエリパフォーマンスの向上に役立ちます。Amazon S3 バケットを特定の VPC 内に配置する必要があるガバナンスやセキュリティ設定を導入しているお客様は、Glue カタログでバケットを使用できるようになりました。これにより、Apache Iceberg のデータが Amazon S3 のどこに保存されていても、より広い範囲でこのデータを自動管理できます。

Amazon VPC からの Iceberg テーブルの自動最適化は、米国東部 (バージニア北部、オハイオ)、米国西部 (オレゴン)、欧州 (アイルランド、ロンドン、フランクフルト、ストックホルム)、アジアパシフィック (東京、ソウル、ムンバイ、シンガポール、シドニー)、南米 (サンパウロ) の 13 の AWS リージョンでご利用いただけます。お客様は AWS コンソール、AWS CLI、AWS SDK を使用してこの機能を有効にすることができます。

デフォルトの保持期間や参照されていないファイルを保存する日数などの最適化設定に加えて、追加の設定として Glue ネットワーク接続を指定できるようになりました。AWS Glue データカタログは Glue 接続の VPC 情報を使用して Amazon S3 バケットにアクセスし、Apache Iceberg テーブルを最適化します。
詳細については、ブログをご一読のうえ、AWS Glue データカタログのドキュメントを参照してください。