Таблицы Amazon S3 уменьшают стоимость сжатия на 90 %
Таблицы Amazon S3 удешевляют стоимость операций сжатия таблиц Apache Iceberg и уменьшают плату за обработку на 90 %. Таблицы S3 предоставляют хранилище, оптимизированное для рабочих нагрузок аналитики, которое автоматизирует операции обслуживания, такие как сжатие, чтобы непрерывно повышать производительность запросов и снижать затраты на хранение. Благодаря уменьшению цен на сжатие стоимость каждого объекта теперь снизилась на 50 %, стоимость обработки за байт при binpack-сжатии – на 90 %, а при сжатии с сортировкой и z-упорядочением – на 80 %.
Таблицы S3 поддерживают три стратегии автоматического сжатия, разработанные для разных шаблонов запросов. Стратегия binpack используется по умолчанию и объединяет файлы для простейшей оптимизации. Сжатие с сортировкой упорядочивает данные по определенным столбцам, чтобы сократить число сканирований файлов в ходе запросов. Сжатие с z-упорядочением помогает при запросе нескольких столбцов одновременно. Если в метаданных таблицы определен порядок сортировки, таблицы S3 автоматически применяют при сжатии иерархическую сортировку, а сжатие с z-упорядочением доступно через API обслуживания таблиц S3.
Сниженные цены на сжатие таблиц S3 вступают в силу с 1 июля 2025 г. во всех регионах AWS, где доступны эти таблицы, и они будут автоматически отражены в вашем счете AWS. Подробности см. на странице цен Amazon S3 и в документации по обслуживанию таблиц S3.