Amazon SageMaker Autopilot 增加自动交叉验证功能，将较小数据集的模型质量最高提升 35%

发布于: May 28, 2021

Amazon SageMaker Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型，同时允许您保持完全控制和可见性。从现在开始，Autopilot 会对 50,000 行以下的数据集执行所有问题类型的交叉验证，这包括回归、二分类和多分类验证。借助交叉验证功能，您可活得更好的稳健性，消除训练数据和验证数据之间不理想拆分的影响，从而提高模型质量。根据数据集和问题类型的不同，您最高可将模型质量提升 35%。

Autopilot 会自动将输入数据拆分为训练数据集和验证数据集。发布此功能后，Autopilot 还会使用 k 次交叉验证方法，并使用来自最佳验证指标实验的交叉验证模型整体进行推理。Autopilot 会确保每次训练和验证都同等代表每个类，以帮助提高精确度并使用可用的数据构建最优的模型。在选择部署模型之前，您可以在 Autopilot 实验的输出中查看每个模型的最终验证方法。此外，Amazon CloudWatch 中也提供了详细的交叉验证更新，包括每次使用的训练和验证指标。

自动交叉验证功能现已在当前支持 SageMaker Autopilot 的所有 AWS 区域开放。要开始使用，请查看我们的文档或访问 Amazon SageMaker Studio 以创建新的 Autopilot 实验。

Amazon SageMaker Autopilot 增加自动交叉验证功能，将较小数据集的模型质量最高提升 35%

终止对 Internet Explorer 的支持