Amazon SageMaker 无服务器推理现已正式发布

发布于: Apr 21, 2022

今天，我们很高兴地宣布 Amazon SageMaker 无服务器推理在已全面推出 SageMaker 的所有 AWS 区域（AWS 中国区域除外）正式发布。借助 Amazon SageMaker 无服务器推理，您可以快速部署机器学习 (ML) 模型进行推理，而不必配置或管理底层基础设施。在部署机器学习模型时，只需选择无服务器选项，Amazon SageMaker 就会根据推理请求的数量自动预置、扩展和关闭计算容量。使用 SageMaker 无服务器推理，您只需为用于处理推理请求的计算容量（按毫秒计费）和处理的数据量付费，而无需为空闲时间付费。SageMaker 无服务器推理非常适合具有间歇性或不可预测流量的应用程序。

自从在 re:Invent 2021 中发布预览版以来，我们增加了对 Amazon SageMaker Python SDK 的支持，它提供抽象以简化模型部署，同时支持模型注册表，可将无服务器推理端点与 MLOps 工作流集成。我们还将每个端点的最大并发调用限制增加到 200（预览版中为 50），这样就可将 SageMaker 无服务器推理用于高流量工作负载。

可以从 AWS 控制台、AWS SDK for Python (Boto3)、SageMaker Python SDK、AWS CloudFormation 或 AWS Command Line Interface (AWS CLI) 创建 SageMaker 无服务器推理端点。SageMaker 无服务器推理现已在以下 21 个 AWS 区域正式发布：美国东部（俄亥俄）、美国东部（弗吉尼亚北部）、美国西部（加利福尼亚北部）、美国西部（俄勒冈）、非洲（开普敦）、亚太地区（香港）、亚太地区（孟买）、亚太地区（大阪）、亚太地区（首尔）、亚太地区（新加坡）、亚太地区（悉尼）、亚太地区（东京）、加拿大（中部）、欧洲（法兰克福）、欧洲（爱尔兰）、欧洲（伦敦）、欧洲（米兰）、欧洲（巴黎）、欧洲（斯德哥尔摩）、中东（巴林）和南美洲（圣保罗）。

入门：

查阅 Amazon SageMaker 无服务器推理博客文章
参考 SageMaker 无服务器推理开发人员指南
在 GitHub 上下载 SageMaker 无服务器推理示例笔记本
访问 Amazon SageMaker 定价页面

Amazon SageMaker 无服务器推理现已正式发布

终止对 Internet Explorer 的支持