发布于: Aug 16, 2023

AWS Glue Studio 现在提供 5 种新的视觉转换:记录匹配、移除空行、从正则表达式中提取字符串片段、解析 JSON 列和提取 JSON 路径。AWS Glue Studio 提供了可视化的提取、转换、加载 (ETL) 界面,用于编写、运行和监控 AWS Glue ETL 作业。借助这些新组件,ETL 开发人员无需编写代码即可快速构建更复杂的数据管道。

这 5 种新的转换都满足独特的数据处理需求:使用“移除空行”来减少行数并仅保留包含数据的行;使用“从正则表达式中提取字符串片段”来提取字符串的相关部分并选择相关信息;结合使用 Glue 的机器学习模型与“纪录匹配”来识别数据集中的其他潜在重复项;使用“解析 JSON 列”来转换 JSON 字符串,以便将 JSON 字符串转换为数据结构或数组;或者使用“提取 JSON 路径”来仅提取您所需的 JSON 路径。这些新的转换可用在基于视觉元素和基于代码的作业中。

这项新功能现已在推出 AWS Glue 的所有 AWS 商业区域提供。请访问 AWS 区域性服务列表,了解最新的可用性信息

要了解更多信息,请访问 AWS Glue 文档