发布于: Jun 23, 2023
Amazon SageMaker Inference Recommender 是 Amazon SageMaker 的一项功能,它可以在 SageMaker 机器学习实例之间自动执行负载测试和模型优化,从而缩短将机器学习 (ML) 模型投入生产所需的时间。今天,SageMaker Inference Recommender 宣布推出两项重要功能。第一项,您现在可以在 AWS 管理控制台中使用 SageMaker Inference Recommender。第二项,Inference Recommender 现在可在创建模型时提供有关用于部署模型的潜在实例的建议。
在模型创建工作流中,客户现在可以查看用于部署模型的潜在实例列表。要定制在创建模型时提供的建议以实现最佳成本或性能,用户可以使用自定义样本输入负载运行基准测试或负载测试任务。用户可以使用 DescribeModel API 以编程方式查看建议的实例列表,也可以通过 SageMaker 控制台 UI 查看建议的实例列表。
此外,客户现在可以在 AWS 管理控制台中使用 SageMaker Inference Recommender。以前,客户只能通过 AWS SDK、AWS CLI 或 SageMaker Studio 运行 Inference Recommender 任务。更喜欢使用 AWS 管理控制台的客户必须在 SDK、Studio 和 AWS 管理控制台之间导航才能获得建议,而仅使用 AWS 管理控制台的客户根本无法从中受益。通过此次发布,AWS 管理控制台用户现在可以在控制台中运行 Inference Recomperder 任务来获取潜在的实例类型,还能运行基准测试任务来获得针对成本和性能进行优化的建议。
要了解有关这些发布的更多信息,请访问此处和此处的文档。要开始使用,请登录 Amazon SageMaker 控制台。