发布于: Aug 23, 2023

我们很高兴地宣布,客户现在可以使用滚动部署策略更新他们的 Amazon SageMaker 端点。滚动部署让您可以更轻松地更新部署在数百个常用加速计算实例上的完全扩展的端点。

借助 Amazon SageMaker,您可以轻松将机器学习模型部署到端点并进行调用,以最佳性价比对任何使用案例进行预测(也称为推理)。之前,SageMaker 仅在必须使用新模型更新端点时才支持蓝绿部署。蓝绿部署在将流量从旧实例集转移到新实例集之前,会先使用更新后的模型预置新的实例集。因此,当您使用新模型更新端点时,您需要的实例数量是端点使用的实例数量的两倍。通过滚动部署,每次流量转移到新端点后,都会清理旧端点上的实例,从而减少更新端点所需的额外实例数量。这种新的更新策略是部署防护机制的一部分,它让您可以控制流量转移步骤的大小,并可以指定评估期以监控新实例是否存在问题,然后再从旧端点终止实例。

您可以在提供 Amazon SageMaker 的所有商业区域通过我们的 API、SDK 和 CloudFormation 使用此功能。

要了解有关滚动部署的更多信息,包括如何进行设置,请参阅我们的文档。要了解不同的端点更新策略,请参阅我们的在生产环境中更新模型文档