Amazon S3 が Apache Iceberg テーブルのソート圧縮と Z オーダー圧縮のサポートを開始
投稿日:
2025年6月24日
Amazon S3 が Apache Iceberg テーブルのソート圧縮と Z オーダー圧縮をサポートするようになりました。これは、Amazon S3 Tables と、AWS Glue データカタログによる最適化を使用した汎用 S3 バケットの両方で利用できます。Iceberg テーブルのソート圧縮により、クエリエンジンがスキャンするデータファイルの数が最小限に抑えられるため、クエリのパフォーマンスが向上し、コストが削減されます。Z オーダー圧縮では、複数の列にわたって同時にクエリを実行する場合に、ファイルプルーニングが効率化されるため、パフォーマンスがさらに向上します。
S3 Tables では、テーブルメタデータでソート順序が定義されている場合、圧縮時に列に階層ソートが自動的に適用されるフルマネージド型の機能を利用できます。複数のクエリ述語に同じ優先順位を付ける必要がある場合は、S3 Tables メンテナンス API を使用して Z オーダー圧縮を有効にできます。汎用 S3 バケットで Iceberg テーブルを使用する場合は、AWS Glue データカタログコンソールで最適化を有効にし、希望する圧縮方法を指定できます。
これらの追加の圧縮機能は、S3 Tables や、AWS Glue データカタログによる最適化が利用できるすべての AWS リージョンで利用可能です。詳細については、AWS ニュースブログ、S3 Tables のメンテナンスに関するドキュメント、AWS Glue データカタログによる最適化に関するドキュメントをご覧ください。