Anunciamos las tablas de Amazon S3: tablas de Apache Iceberg completamente administradas y optimizadas para cargas de trabajo de análisis

Publicado en: 3 de dic de 2024

Las tablas de Amazon S3 ofrecen el primer almacén de objetos en la nube con compatibilidad integrada con Apache Iceberg y la forma más sencilla de almacenar datos tabulares a escala. Las tablas de S3 están optimizadas específicamente para las cargas de trabajo de análisis, lo que se traduce en un rendimiento de consultas hasta 3 veces más rápido y hasta 10 veces más transacciones por segundo en comparación con las tablas autoadministradas. Gracias a la compatibilidad de las tablas de S3 con el estándar Apache Iceberg, los conocidos motores de consulta de AWS y de terceros pueden consultar fácilmente sus datos tabulares. Además, las tablas de S3 están diseñadas para realizar un mantenimiento continuo de las tablas a fin de optimizar automáticamente la eficiencia de las consultas y los costos de almacenamiento a lo largo del tiempo, incluso a medida que su lago de datos se escala y evoluciona. La integración de las tablas de S3 con el catálogo de datos de AWS Glue está en versión preliminar y le permite transmitir, consultar y visualizar datos (incluidas las tablas de metadatos de S3) mediante los servicios de análisis de AWS, como Amazon Data Firehose, Athena, Redshift, EMR y QuickSight.

Las tablas de S3 introducen los buckets de tablas, un nuevo tipo de buckets diseñado específicamente para almacenar datos tabulares. Con los buckets de tablas, puede crear tablas rápidamente y configurar permisos en las tablas para administrar el acceso a su lago de datos. A continuación, puede cargar y consultar datos en sus tablas con SQL estándar y aprovechar las capacidades de análisis avanzadas de Apache Iceberg, como las transacciones en las filas, las instantáneas que se pueden consultar, la evolución de los esquemas y más. Los buckets de tablas también ofrecen un mantenimiento de tablas basado en políticas, lo que lo ayuda a automatizar las tareas operativas, como la compactación, la administración de instantáneas y la eliminación de archivos sin referencia.

Las tablas de Amazon S3 ya están disponibles en las regiones Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio) y Oeste de EE. UU. (Oregón), y próximamente estarán disponibles en otras regiones. Para obtener más información sobre los precios, visite la página de precios de S3. Para obtener más información, visite la página del producto, la documentación y el blog de noticias de AWS.