发布于: Sep 1, 2022

SageMaker Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型,同时让您保持完全控制权和可见性。即日起,您在创建 Autopilot 实验来训练机器学习模型时,可以自定义用于模型训练和验证的数据拆分。Autopilot 默认按 80%-20% 拆分规则拆分指定的数据集,分别保留用于训练和验证。借助这次发布的功能,您可以自定义训练和验证数据拆分百分比,也可以提供两个数据集,一个用于训练,另一个用于验证。此功能可在 Amazon SageMaker Studio 和 SageMaker Autopilot API 中使用。

为了更高效地选择训练和验证数据集,这次发布还包含了一个经过改进的用户界面,用于提供友好的 S3 浏览体验以及一个有分步指导的工作流,后者旨在帮助您获得对高级设置的完全控制权和可见性。

要开始使用,请将 Amazon SageMaker Studio 更新到最新版本,然后从 SageMaker Studio 启动器Amazon SageMaker Data Wrangler 训练模型工作流启动 SageMaker Autopilot。 要了解有关如何更新 Studio 的更多信息,请参阅文档

这些新功能和体验现已在支持 SageMaker Autopilot 的所有区域推出。要开始使用,请参阅使用 Autopilot 创建实验SageMaker Autopilot API 参考。 要了解更多信息,请访问 SageMaker Autopilot 产品页