发布于: Nov 17, 2023

AWS Glue for Apache Spark 宣布推出六款新的数据库连接器:Teradata、SAP HANA、Azure SQL、Azure Cosmos DB、Vertica 和 MongoDB。通过这些原生连接器,用户可以高效地从这些系统读取和写入数据,而无需安装或管理任何连接器库。用户现在可以在 AWS Glue Studio 的无代码、拖放式可视界面中将这些数据库添加为源或目标,也可以直接在 AWS Glue ETL 脚本作业中使用连接器。

对于 Teradata、SAP HANA、Azure SQL 和 Vertica,用户可以指定单个表或输入自定义查询来选择其数据。对于 MongoDB,他们可以指定文档集合。对于 Azure Cosmos DB,他们可以指定容器并选择性地提供自定义查询。在创作可视 ETL 作业时,他们可以预览其源数据集以更快地找到正确的数据。用户还可以在其 ETL 管道中将这些数据库用作目标来编写转型步骤的输出。

借助这些功能,ETL 开发人员可以在单个界面中使用 AWS Glue 和受支持的数据库处理各种数据情况。要开始使用,请在 AWS Glue 中创建与所需数据库的新连接,并将其作为源或目标添加到您的 Glue ETL 任务中。

此功能已在提供 AWS Glue 的所有商业 AWS 区域推出。

要了解更多信息,请访问 AWS Glue 文档