发布于: May 27, 2021
AWS Glue DataBrew 现在支持嵌套和解嵌套转换,从而帮助用户从列中装入或提取数据以操作其数据集。借助这些转换,用户现在无需编写任何代码,即可轻松从嵌套的 json 字符串字段提取数据或合并数据。
要嵌套数据,用户可以从源列表中选择数据,然后将其装入为某个 struct(结构体)、map(映射)或 array(数组)格式。要解嵌套数据,用户可以从数组、结构体或字符串列提取嵌套的数据来创建新的行或列。用户可以对多个级别的输入 json 数据执行解嵌套运算。此外,用户还可以提取嵌套字符串列的键/值来创建单独的列,并将现有的 json 字符串列更改为数组列或结构体列。要进一步了解数据结构转换,请单击此处。
AWS Glue DataBrew 是一种可视化的数据准备工具,它让您能够轻松地利用 250 多个预构建的转换来清理和规范化数据,以进行数据准备,而无需编写任何代码。
要开始使用,请访问 AWS 管理控制台或在您的笔记本环境中安装 DataBrew 插件,并参阅 DataBrew 文档,以了解各种可用的转换。