发布于: Sep 8, 2022

Amazon SageMaker Canvas 宣布推出通过高级可视化执行探索性数据分析 (EDA) 的附加功能,使您能够在构建机器学习 (ML) 模型之前更好地探查和分析数据。SageMaker Canvas 是一个可视化的点击式界面,可帮助业务分析师自行生成准确的机器学习预测,而无需任何机器学习经验或编写任何代码。 

即日起,Amazon SageMaker Canvas 将为 EDA 提供新的可视化,使您能够在模型构建之前更好地了解数据。这些可视化扩大了已由 Canvas 提供的数据准备和探查功能范围,例如灵活的数据采样大小、插补缺失值、替换异常值、筛选、连接和修改数据集以及扩展的时间戳格式。此类可视化有助于您分析数据集内功能间的关系和更好地理解数据。这是通过易于读取的可视化格式实现的,此类格式能与数据交互并发现临时查询中可能忽略的见解。在构建和训练机器学习模型之前,可以在 SageMaker Canvas 中通过数据可视化工具快速创建这些模型。新的可视化包括:

  • 散点图:这些图可用于观察数据中不同数值变量之间的关系。点用于表示两个不同数值变量的值,每个点的位置则表示特定数据点在水平轴和垂直轴上的值。
  • 条形图:这些图可用于汇总一组用条形表示的分类数据,用于即时数据比较。各个条形的高度则表示特定数据聚合的比例。
  • 箱形图:这些图可通过四分位数表示数值数据组。箱形图有助于您确定数据值如何分布。图形视图表示一组或多组数值数据的分布。

推出 SageMaker Canvas 的所有 AWS 区域均支持所有 EDA 功能(包括新推出的可视化)。要了解有关 Canvas、受支持的区域和入门的更多信息,请参阅 Canvas 文档产品页面以及常见问题页面