Publicado: Nov 17, 2023

O AWS Glue para Apache Spark anuncia o lançamento de seis novos conectores de banco de dados: Teradata, SAP HANA, Azure SQL, Azure Cosmos DB, Vertica e MongoDB. Esses conectores nativos permitem que os usuários leiam e gravem dados desses sistemas com eficiência sem a necessidade de instalar ou gerenciar nenhuma biblioteca de conectores. Os usuários podem adicionar esses bancos de dados como origem ou destino na interface visual do tipo arrastar e soltar e sem código do AWS Glue Studio ou usar o conector diretamente em um trabalho de script de ETL do AWS Glue.

Para Teradata, SAP HANA, Azure SQL e Vertica, os usuários podem especificar uma única tabela ou inserir uma consulta personalizada para selecionar dados. Para MongoDB, eles podem especificar a coleção de documentos. Para Azure Cosmos DB, eles podem especificar o contêiner e, opcionalmente, fornecer uma consulta personalizada. Quando criam trabalhos visuais de ETL, eles podem visualizar o conjunto de dados de origem para encontrar os dados certos com mais rapidez. Os usuários também podem usar esses bancos de dados como destinos de pipelines de ETL para gravar a saída das etapas de transformação.

Esses recursos permitem que desenvolvedores de ETL trabalhem com o AWS Glue em uma variedade de situações de dados usando uma única interface. Para começar a usar, crie no AWS Glue uma nova conexão com o banco de dados desejado e adicione-a como origem ou destino a um trabalho de ETL do Glue.

Esse recurso está disponível em todas as regiões comerciais da AWS que oferecem o AWS Glue.

Para saber mais, acesse a documentação do AWS Glue.