发布于: Nov 7, 2022
Amazon SageMaker Canvas 宣布支持用于高级数据分析的相关矩阵,从而扩展了在构建 ML 模型之前从数据中获取见解的功能。SageMaker Canvas 是一个可视化的点击式界面,可帮助业务分析师自行生成准确的机器学习预测,而无需任何机器学习经验或编写任何代码。
SageMaker Canvas 提供了数据分析和探索功能(例如使用标准值或自定义值插补缺失值和异常值的功能),从而使用数学函数和运算符定义和创建新功能,以及通过箱形图、条形图和散点图对数据进行可视化探索。从今天开始,SageMaker Canvas 支持相关矩阵,从而允许您将数据集汇总为一个矩阵,该矩阵显示两个或更多值之间的相关性以及它们之间的关系。这有助于您识别和可视化给定数据集的模式以进行高级分析。
现在,您可以为数值、分类和这两个变量的组合生成相关矩阵。可以使用 Pearson 或 Spearman 相关性对数据集进行数值分析,也可以使用交互信息进行分类值分析,从而为您提供了选择和灵活性。这些矩阵的输出可用于插补缺失数据、为值分配权重以了解方差,还可用于其他高级分析。相关矩阵适用于许多使用案例,例如,基于供需分析价格差异、基于天气模式预测降雨量以及基于产品或服务的新功能了解购买倾向。