Amazon SageMaker AI 现在支持用于推理的灵活训练计划计算资源

发布于: 2025年11月26日

Amazon SageMaker AI 的灵活训练计划(FTP)现在支持推理端点,让客户能够在计划的评估和生产高峰期间获得有保障的 GPU 计算资源。现在,客户可以预留所需的确切实例类型,并依靠 SageMaker AI 自动启动推理端点,而无需自行管理任何基础设施。

在规划机器学习开发周期时,客户需要确保用于模型评测和预生产测试的 GPU 资源能够在预定的时间准备就绪。灵活训练计划让客户能够轻松获取 GPU 计算资源来运行机器学习工作负载。借助灵活训练计划对推理端点的支持,您可以根据自身需求,为推理工作负载选择实例类型、计算要求、预留时长和开始日期。在创建端点时,您只需引用预留 ARN,SageMaker AI 便会在整个计划周期内,自动在有保障的计算资源上预置并运行该端点。这样可以省去数周的基础设施管理和调度工作,让您能够以可预测的方式进行推理操作,同时将时间集中用于提升模型性能。

灵活训练计划对 SageMaker AI 推理的支持已在以下区域推出:美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、美国东部(俄亥俄州)。

要了解有关将灵活训练计划预留用于推理端点的更多信息,请单击此处,查看 SageMaker AI 推理 API 参考文档。