Publicado en: Jul 25, 2023
Amazon Redshift anuncia hoy la versión preliminar de la compatibilidad con Apache Iceberg, que permite a los usuarios ejecutar consultas de análisis en tablas de Apache Iceberg en Redshift. Amazon Redshift es un servicio de almacenamiento de datos en la nube de nivel empresarial a escala de petabytes que utilizan decenas de miles de clientes. Ya sea que sus datos estén almacenados en almacenes de datos operativos, lagos de datos, motores de streaming o dentro de su almacén de datos, Amazon Redshift le ayuda a ingerir datos rápidamente, a compartirlos de forma segura y a lograr el mejor rendimiento al mejor precio. Muchos clientes han utilizado Apache Iceberg, uno de los formatos de tablas abiertas más recientes, para simplificar el procesamiento de datos en tablas en rápida expansión y evolución almacenadas en lagos de datos.
Los clientes han estado utilizando Amazon Redshift para ejecutar consultas en tablas de lagos de datos en varios formatos de archivos y tablas, con lo que han conseguido una amplia gama de escalabilidad en las cargas de trabajo de almacenes y lagos de datos. Los casos de uso de los lagos de datos siguen evolucionando y se vuelven cada vez más sofisticados, y requieren capacidades como la coherencia transaccional para las actualizaciones y eliminaciones a nivel de registro, además de contar con un soporte perfecto para la evolución de esquemas y particiones. Ahora puede usar Amazon Redshift para consultar las tablas de Apache Iceberg en el catálogo de datos de AWS Glue, mientras que otros usuarios o aplicaciones pueden manipular los datos de sus tablas de forma segura mediante servicios que cumplen con ACID (atomicidad, consistencia, aislamiento y durabilidad), como Amazon EMR, Amazon Athena y AWS Glue.
Puede usar la compatibilidad con Apache Iceberg en Amazon Redshift en todas las regiones de AWS, excepto en China (Beijing), China (Ningxia) y las regiones de AWS GovCloud (EE. UU.). Para empezar, consulte la Guía de administración de Amazon Redshift.