发布于: Jul 25, 2023
AWS Glue Studio Visual ETL 作业现在支持在转换过程中使用 DataBrew 配方。AWS Glue Studio Visual ETL 是一种采用流程图界面的无代码作业编写工具,适用于 ETL 开发人员。AWS Glue DataBrew 是一种适用于企业用户和数据分析师的无代码数据准备工具,采用电子表格式用户界面。两者的新集成让 DataBrew 作业的部署和扩展变得更加简单,并且让 DataBrew 用户能够使用 DataBrew 无法提供的 AWS Glue 功能。这种集成也适用于基于代码的作业。
企业用户在 DataBrew 中定义数据清理和准备“配方”后,技术用户通常会部署和扩展 DataBrew 作业。通过这种新的集成,客户现在可以扩展配方来处理 PB 级数据,并得以支付更低的 AWS Glue 作业费用。您可以在 AWS Glue 4.0 中运行 DataBrew 配方,这样可以提高性能并自动扩展,从而降低成本。您还可以使用具有 AWS Glue 功能的配方,包括自定义转换、增量处理和合并多个数据集等。
此功能已在推出 AWS Glue 的 AWS 区域提供,亚太地区(大阪)、中东(巴林)、GovCloud 和中国区域除外。
2023 年 7 月 31 日 - 这篇文章已经更新,更正了提供该功能的区域列表。