发布于: Apr 21, 2022

今天,我们很高兴地宣布 Amazon SageMaker 无服务器推理在已全面推出 SageMaker 的所有 AWS 区域(AWS 中国区域除外)正式发布。借助 Amazon SageMaker 无服务器推理,您可以快速部署机器学习 (ML) 模型进行推理,而不必配置或管理底层基础设施。在部署机器学习模型时,只需选择无服务器选项,Amazon SageMaker 就会根据推理请求的数量自动预置、扩展和关闭计算容量。使用 SageMaker 无服务器推理,您只需为用于处理推理请求的计算容量(按毫秒计费)和处理的数据量付费,而无需为空闲时间付费。SageMaker 无服务器推理非常适合具有间歇性或不可预测流量的应用程序。

自从在 re:Invent 2021 中发布预览版以来,我们增加了对 Amazon SageMaker Python SDK 的支持,它提供抽象以简化模型部署,同时支持模型注册表,可将无服务器推理端点与 MLOps 工作流集成。我们还将每个端点的最大并发调用限制增加到 200(预览版中为 50),这样就可将 SageMaker 无服务器推理用于高流量工作负载。

可以从 AWS 控制台、AWS SDK for Python (Boto3)、SageMaker Python SDK、AWS CloudFormation 或 AWS Command Line Interface (AWS CLI) 创建 SageMaker 无服务器推理端点。SageMaker 无服务器推理现已在以下 21 个 AWS 区域正式发布:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、非洲(开普敦)、亚太地区(香港)、亚太地区(孟买)、亚太地区(大阪)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)、加拿大(中部)、欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(米兰)、欧洲(巴黎)、欧洲(斯德哥尔摩)、中东(巴林)和南美洲(圣保罗)。

入门: