Publicado en: May 25, 2023

Nos complace anunciar el lanzamiento de AWS Glue 4.0 para la región AWS GovCloud (Oeste de EE. UU.). AWS Glue 4.0 es una nueva versión de AWS Glue que acelera las cargas de trabajo de integración de datos en AWS. AWS Glue 4.0 actualiza los motores Spark para Apache Spark 3.3.0 y Python 3.10. Glue 4.0 ofrece a los clientes los últimos lanzamientos de Spark y Python para que puedan desarrollar, ejecutar y escalar sus cargas de trabajo de integración de datos y obtener información con mayor rapidez.

AWS Glue es un servicio de integración de datos escalable y sin servidor que simplifica la detección, la preparación, el traslado y la integración de datos de varios orígenes. AWS Glue 4.0 agrega compatibilidad con las API integradas de Pandas y con los marcos de lagos de datos (Apache Hudi, Apache Iceberg y Delta Lake), para que tenga más opciones para analizar y almacenar sus datos. Actualice los conectores para los orígenes nativos de las bases de datos de AWS Glue como RDS, MySQL y SQLServer, lo que simplifica las conexiones con los orígenes de bases de datos comunes. AWS Glue 4.0 también agrega compatibilidad nativa con el nuevo complemento de almacenamiento aleatorio en la nube para Apache Spark, lo que ayuda a los clientes a escalar el uso del disco durante el tiempo de ejecución. Permite la ejecución adaptativa de consultas a fin de optimizar dinámicamente sus consultas a medida que se ejecuta. Por último, AWS Glue 4.0 mejora la experiencia del desarrollador al agregar más contexto a los mensajes de error. Al igual que con AWS Glue 3.0, los clientes solo pagan por los recursos que utilizan.

Para obtener más información, consulte nuestra documentación.