Publicado en: Nov 28, 2022

Nos complace anunciar el lanzamiento de la versión 4.0 de AWS Glue, una nueva versión de AWS Glue que acelera las cargas de trabajo de integración de datos en AWS. AWS Glue 4.0 actualiza los motores Spark para Apache Spark 3.3.0 y Python 3.10. Glue 4.0 ofrece a los clientes los últimos lanzamientos de Spark y Python para que puedan desarrollar, ejecutar y escalar sus cargas de trabajo de integración de datos y obtener información con mayor rapidez.

AWS Glue es un servicio de integración de datos escalable y sin servidor que simplifica la detección, preparación, movimiento e integración de datos de varios orígenes. AWS Glue 4.0 agrega compatibilidad con las API de Pandas integradas además de compatibilidad con los formatos Apache Hudi, Apache Iceberg y Delta Lake, así tiene más opciones para analizar y almacenar sus datos. Actualiza los conectores para los orígenes nativos de las bases de datos de AWS Glue como RDS, MySQL y SQLServer, lo que simplifica las conexiones con los orígenes de bases de datos comunes. AWS Glue 4.0 también agrega compatibilidad nativa con el nuevo complemento de almacenamiento aleatorio en la nube para Apache Spark, lo que ayuda a los clientes a escalar el uso del disco durante el tiempo de ejecución. Permite la ejecución adaptativa de consultas a fin de optimizar dinámicamente sus consultas a medida que se ejecuta. Por último, AWS Glue 4.0 mejora la experiencia del desarrollador al agregar más contexto a los mensajes de error. Al igual que con AWS Glue 3.0, los clientes solo pagan por los recursos que utilizan.

AWS Glue 4.0 tiene disponibilidad general en la actualidad en todas las regiones de AWS donde AWS Glue está disponible, excepto en las regiones de China y en las regiones de AWS GovCloud (EE. UU.).

Para obtener más información, consulte nuestra documentación.