发布于: Jul 25, 2023

Amazon SageMaker Canvas 现在支持五项新的数据转换功能,使您能够在构建机器学习 (ML) 模型之前更好地准备和分析数据。数据是机器学习的基础,转换原始数据使其适用于构建 ML 模型和生成预测是获得更好见解的关键。即日起,SageMaker Canvas 使您能够在数值、文本和日期时间之间更改列中的数据类型,同时还显示该数据类型(例如二进制和类别)的相关特征。这使您可以灵活地根据特征手动更改列中的数据类型。在构建 ML 模型之前,能够选择正确的数据类型可确保数据的完整性和准确性。例如,使用日期时间数据类型可确保该特定列中仅存储有效日期。 

此外,Canvas 还使您能够重新采样时间序列数据,为时间序列数据集中的观测值建立固定间隔。当时间序列数据包含间隔不固定的观测值时,这尤其有用。重新采样这些数据将有助于您在固定时间间隔之间平均分配数据,使其对分析和预测等下游操作非常有用。最后,Canvas 现在还提供更好的方法来管理数据中的行,使您能够按升序或降序对其进行排序、随机排列行以及删除重复行。

这些新的数据转换功能已在目前支持 Canvas 的所有 AWS 区域推出。要了解更多信息,请参阅产品文档