发布于: Mar 9, 2021
当您在数据集上生成数据质量配置文件时,DataBrew 在 AWS Glue DataBrew 控制台上发布了一个可视化控制面板,其中以表格形式列出了 40 多个统计和可视化数据,以便轻松进行比较。了解数据质量是分析和机器学习项目成功的关键。使用 DataBrew 的这项新功能,可以针对从几千行到数千万行不等且文件格式也不同的数据集轻松发现数据分布中的异常、检测异常值、了解偏移等。
AWS Glue DataBrew 是一种可视化的数据准备工具,借助它,可以轻松地利用 250 多个预构建的转换来清理和规范化数据,以进行数据准备,而无需编写任何代码。
要开始使用,请访问 AWS 管理控制台或在您的笔记本环境中安装 DataBrew 插件,并参阅 DataBrew 文档。