Publicado en: Nov 17, 2023

AWS Glue para Apache Spark anuncia el lanzamiento de seis nuevos conectores de bases de datos: Teradata, SAP HANA, Azure SQL, Azure Cosmos DB, Vertica y MongoDB. Estos conectores nativos permiten a los usuarios leer y escribir datos de estos sistemas de manera eficiente sin necesidad de instalar ni administrar ninguna biblioteca de conectores. Los usuarios pueden agregar estas bases de datos como fuente o destino en la interfaz visual sin código de arrastrar y soltar de AWS Glue Studio, o utilizar el conector directamente en un trabajo de script de extracción, transformación y carga (ETL) de AWS Glue.

Para Teradata, SAP HANA, Azure SQL y Vertica, los usuarios pueden especificar una sola tabla o introducir una consulta personalizada para seleccionar sus datos. Para MongoDB, pueden especificar la colección de documentos. Para Azure Cosmos DB, pueden especificar el contenedor y, de forma opcional, hacer una consulta personalizada. Al crear trabajos de ETL visuales, pueden obtener una vista previa de su conjunto de datos de origen para encontrar los datos correctos más rápido. Los usuarios también pueden usar estas bases de datos como destinos en sus canalizaciones de ETL para escribir el resultado de los pasos de transformación.

Estas capacidades permiten a los desarrolladores de ETL trabajar con AWS Glue y bases de datos compatibles en diversas situaciones de datos dentro de una única interfaz. Para empezar, cree una nueva conexión dentro de AWS Glue con la base de datos que desee y agréguela como fuente o destino a su trabajo de ETL en Glue.

Esta característica está disponible en todas las regiones comerciales de AWS en las que está disponible AWS Glue.

Para obtener más información, consulte la documentación de AWS Glue.