回归基础系列课程:SageMaker 机器学习模型部署中的推理选项选择最佳实践

回归基础系列课程:SageMaker 机器学习模型部署中的推理选项选择最佳实践

机器学习 | 无服务器

回归基础系列课程:SageMaker 机器学习模型部署中的推理选项选择最佳实践

回归基础系列课程:SageMaker 机器学习模型部署中的推理选项选择最佳实践

云计算
视频对我有帮助
关闭
感谢您的反馈!

视频简介
视频简介

一起来了解如何根据延迟、吞吐量、有效负载大小和流量模式等要求选择最佳的 Amazon SageMaker 推理选项来部署机器学习模型。

在本期视频中,跟随 Jyoti 一起探讨如何选择以下四种部署选项:

  • SageMaker 实时推理:适用于低延迟、高吞吐量的使用场景,如欺诈侦测、广告投放和个性化推荐。支持最大 6 MB 的有效负载和 60 秒的处理时间。
  • SageMaker 无服务器推理:最适合间歇性或不可预测的流量,支持冷启动。自动扩展资源。支持最大 4 MB 的有效负载和 60 秒的处理时间。
  • SageMaker 异步推理:将请求进行排队,支持大型有效负载(最大 1GB)或长处理时间(最长 15 分钟)。可以将端点量缩减至零,从而实现高性价比。非常适合计算机视觉和对象检测场景。
  • SageMaker 批量转换:用于离线处理大型数据集(GB 级)或更长的处理时间(以天为单位)。适用于数据预处理、客户流失率预测、预测性维护等场景,提供最高吞吐量。

我们将通过一个真实的欺诈侦测示例,介绍如何设置

SageMaker 实时推理端点、发送请求并实时获取预测。该示例应用满足低延迟和高吞吐量的要求。

更多资源:

https://docs.aws.amazon.com/sagemaker/latest/dg/deploy-model.html

快来 查看更多关于 AWS 云架构的资源
关闭
感谢您的反馈!