发布于: Nov 18, 2021
AWS Glue DataBrew 用户现在可以创建数据质量规则,也就是可自定义的验证检查,以定义特定数据的业务需求。您可以创建规则来检查某些列中的重复值,验证一列与另一列是否匹配,或者根据特定的数据质量使用案例定义更多自定义检查和条件。为了提高效率,可以将给定数据集的规则分组到规则集中,并将这些检查应用为标准数据配置文件任务的一部分。结果将填充在数据质量控制面板和验证报告中,帮助您快速查看规则结果并确定数据是否适合使用。
AWS Glue DataBrew 是一种可视化的数据准备工具,它让您能够轻松地利用 250 多个预构建的转换来清理和规范化数据,而无需编写任何代码。您可以自动筛选异常值、将数据转换为标准格式、纠正无效值和执行其他任务。
要开启使用 DataBrew,请访问 AWS 管理控制台或在您的笔记本环境中安装 DataBrew 插件。要了解详情,请查看此入门视频并参阅 DataBrew 文档。