定价概述
Amazon SageMaker 通过整合专门为机器学习(ML)构建的广泛功能集,帮助数据科学家和开发人员快速准备、构建、训练和部署高质量的机器学习模型。SageMaker 支持领先的 ML 框架、工具包和编程语言。
使用 SageMaker,您只需按实际用量付费。您有两种付费选择:没有最低费用也没有预先承诺的按需定价,以及 SageMaker Savings Plans,它提供了一种基于用量的灵活定价模式,以换取对持续使用量的承诺。
Amazon SageMaker 免费套餐
Amazon SageMaker 可免费试用。作为 AWS 免费套餐的一部分,您可以从免费使用 Amazon SageMaker 开始。您的免费套餐从您创建第一个 SageMaker 资源的第一个月开始。如需了解关于 Amazon SageMaker 免费套餐的详细信息,请见下表。
Amazon SageMaker 的功能 | 免费套餐前 2 个月的每个月使用情况 |
Studio 笔记本以及笔记本实例 | Studio 笔记本上的 250 个小时 ml.t3.medium 实例,或者笔记本实例上的 250 个小时 ml.t2 medium 实例或 ml.t3.medium 实例 |
RStudio on SageMaker | RSession 应用程序上 250 个小时的 ml.t3.medium 实例和 RStudioServerPro 应用程序的免费 ml.t3.medium 实例 |
Data Wrangler | 25 个小时 ml.m5.4xlarge 实例 |
特征存放区 | 1000 万个写单元,1000 万个读单元,25GB 存储(标准在线存储) |
培训 | 50 个小时 m4.xlarge 或 m5.xlarge 实例 |
带有 TensorBoard 的 Amazon SageMaker | 300 个小时 ml.r5.large 实例 |
实时推理 | 125 个小时 m4.xlarge 或 m5.xlarge 实例 |
无服务器推理 | 150000 秒按需推理持续时间 |
Canvas | 每月 160 小时的会话时间 |
HyperPod | 50 小时的 m5.xlarge 实例 |
按需定价
-
Studio Classic
-
JupyterLab
-
代码编辑器
-
RStudio
-
笔记本实例
-
Processing
-
TensorBoard
-
Data Wrangler
-
特征存放区
-
培训
-
MLflow
-
实时推理
-
异步推理
-
批量转换
-
无服务器推理
-
JumpStart
-
分析工具
-
HyperPod
-
推理优化
-
Studio Classic
-
Amazon SageMaker Studio Classic
Studio Classic 在我们传统的 IDE 体验中提供一步式 Jupyter 笔记本。底层计算资源具有完全弹性,而笔记本支持轻松与他人共享,从而实现无缝协作。根据使用时长,您要为所选择的实例类型付费。 -
JupyterLab
-
Amazon SageMaker JupyterLab
在几秒钟内启动完全托管的 JupyterLab。使用最新的基于 Web 的交互式开发环境来处理笔记本、代码和数据。根据使用时长,您要为所选择的实例类型付费。 -
代码编辑器
-
Amazon SageMaker 代码编辑器
基于 Code-OSS(Visual Studio 代码 — 开源)的代码编辑器使您能够编写、测试、调试和运行分析和 ML 代码。它与 SageMaker Studio 完全集成,支持 Open VSX 扩展注册表中提供的 IDE 扩展。 -
RStudio
-
RStudio
RStudio 提供按需云计算资源,以加快模型开发并提高生产力。 您需要为您选择运行 RStudio Session 应用程序和 RStudio Server Pro 应用程序的实例类型付费。
RStudioServerPro 应用程序
-
笔记本实例
-
笔记本实例
笔记本实例是运行 Jupyter notebook 应用程序的计算实例。根据使用时长,您要为所选择的实例类型付费。
-
Processing
-
Amazon SageMaker Processing
Amazon SageMaker Processing 使您可以在完全托管的基础设施上轻松运行预处理、后处理和模型评估工作负载。根据使用时长,您要为所选择的实例类型付费。
-
TensorBoard
-
带有 TensorBoard 的 Amazon SageMaker
带有 TensorBoard 的 Amazon SageMaker 提供托管的 TensorBoard 体验,用于可视化和调试 Amazon SageMaker 训练作业的模型融合问题。
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler 可将汇总和准备机器学习数据所需的时间从数周缩短至几分钟。您需要为清理、探索和可视化数据所用的时间付费。运行 SageMaker Data Wrangler 实例的客户须遵守以下定价。* 在 SageMaker Canvas 工作区实例上运行 SageMaker Data Wrangler 的客户须遵守 SageMaker Canvas 定价。有关更多详细信息,请参阅 SageMaker Canvas 定价页面。
Amazon SageMaker Data Wrangler 作业
Amazon SageMaker Data Wrangler 作业会在从 SageMaker Data Wrangler 导出数据流时创建。借助于 SageMaker Data Wrangler 作业,您可以对数据准备工作流程进行自动化。SageMaker Data Wrangler 作业将数据准备工作流程重新应用于新的数据集以便帮助您节约时间,而它按秒计费。
-
特征存放区
-
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store 是一种中央存储库,可为机器学习提取、存储和处理特征。您需要为 SageMaker Feature Store 中的特征组写入、读取和数据存储付费,标准在线存储和内存中在线存储的定价不同。对于标准在线存储,数据存储按每月每 GB 收费。对于吞吐量,您可以选择按需或预置容量模式。对于按需模式,写入费用基于写入请求单位(每 KB 一个单位),读取费用基于读取请求单位(每 4KB 一个单位)。对于预置容量模式时,指定预计您的应用程序需要的读取和写入容量。Sagemaker Feature Store 对每秒每次写入(最多 1KB)收取 1 个 WCU 费用,对每秒每次读取(最多 4KB)收取 1 个 RCU 费用。您需要为特征组中预置的吞吐能力(读写)付费,即使您没有完全利用预置容量,也需要付费。
对于内存中在线存储,写入费用基于每 KB 写入请求单位(每次写入至少 1 个单位),读取费用基于每 KB 读取请求单位(每次读取至少 1 个单位),而数据存储费用则基于每小时每 GB。内存中在线存放区的最低数据存储费用为每小时 5 GiB(5.37 GB)。
-
培训
-
Amazon SageMaker 训练
Amazon SageMaker 可提供训练、调优和调试模型所需的一切,从而简化了机器学习 (ML) 模型训练过程。您将按所选实例类型的使用情况付费。当在训练期间使用 Amazon SageMaker Debugger 调试问题和监控资源时,您可以使用内置规则调试您的训练作业,或编写自己的自定义规则。使用内置规则来调试您的训练作业不会产生费用。对于自定义规则,您要根据使用时长为所选择的实例类型付费。
-
MLflow
-
带有 MLflow 的 Amazon SageMaker
带有 MLflow 的 Amazon SageMaker 允许客户仅按实际使用量付费。客户根据计算和存储成本为 MLflow 跟踪服务器付费。
客户将根据跟踪服务器的大小和运行的小时数支付计算费用。此外,客户还需要为 MLflow 跟踪服务器上存储的任何元数据付费。
-
实时推理
-
Amazon SageMaker 托管:实时推理
Amazon SageMaker 为需要实时预测的用例提供实时推理。您将按所选实例类型的使用情况付费。当您借助 Amazon SageMaker Model Monitor 维持高准确性模型以提供实时推理时,您可以使用内置规则来监控模型,也可以编写自己的自定义规则。对于内置规则,您可以免费获得长达 30 小时的监控时间。是否产生额外费用将取决于使用的时长。如果使用自定义规则,您将被单独收取相关费用。
-
异步推理
-
Amazon SageMaker 异步推理:
Amazon SageMaker 异步推理是一种近乎实时的推理选项,可异步对传入请求进行排列与处理。当您需要在数据到达时处理大型负载,或者要运行推理处理时间较长的模型而没有亚秒级延迟要求时,使用此选项。您要为您所选的实例类型付费。 -
批量转换
-
Amazon SageMaker 批量转换
借助 Amazon SageMaker 批量转换,您无需将数据集拆分为多个数据块,也无需管理实时终端节点。SageMaker 批量转换让您可以针对大批量或小批量数据集运行预测。根据使用时长,您要为所选择的实例类型付费。
-
无服务器推理
-
Amazon SageMaker 无服务器版推理
Amazon SageMaker 无服务器推理功能使您能够部署机器学习模型进行推理,而不必配置或管理任何底层基础设施。 您可以使用按需无服务器推理,也可以向端点添加预置并发以实现可预测的性能。使用按需无服务器推理,您只需为用于处理推理请求的计算容量(按毫秒计费)和处理的数据量付费。计算费用取决于您选择的内存配置。
预置并发或者,您也可以为无服务器端点启用预置并发。预置并发可让您在无服务器端点上部署模型,这些模型具有可预测的性能,并且通过让端点在指定时间为指定数量的并发请求保持预热来实现高可扩展性。与按需无服务器推理一样,启用预置并发后,您需要为用于处理推理请求的计算容量(按毫秒计费)和处理的数据量付费。还可以根据配置的内存、预置的持续时间和启用的并发量为预置并发使用量付费。
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart 让您能够一键式访问流行的模型集合(也称为“模型动物园”)可帮助您轻松快速地开始使用机器学习。Jumpstart 还提供能够解决常见机器学习使用案例的端到端解决方案,您可以根据自己的需求对这些解决方案进行自定义。使用 JumpStart 模型或解决方案不会产生额外的费用。您需要按使用的基础训练和推理实例小时数付费,如同这些实例是您手动创建的。
-
分析工具
-
Amazon SageMaker Profiler 收集系统级数据,用于高分辨率 CPU 和 GPU 轨迹图的可视化。该工具旨在帮助数据科学家和工程师识别其深度学习模型中与硬件相关的性能瓶颈,从而节省端到端训练的时间和成本。目前,SageMaker Profiler 仅支持使用 ml.g4dn.12xlarge、ml.p3dn.24xlarge 和 ml.p4d.24xlarge 训练计算实例类型对训练作业进行性能分析。
区域:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)和以色列(特拉维夫)。Amazon SageMaker 探查器目前处于预览阶段,面向支持区域的客户免费提供。
-
HyperPod
-
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod 专为加快基础模型(FM)的开发而构建。为了使 FM 训练更具弹性,它会持续监控集群运行状况、即时修复和更换故障节点,并保存频繁的检查点,以便自动恢复训练而不丢失进度。SageMaker HyperPod 预先配置了 SageMaker 分布式训练库,使您能够在充分利用集群的计算和网络基础设施的同时提高 FM 训练性能注意:SageMaker HyperPod 定价不包括连接到 HyperPod 集群的服务费用,例如 Amazon EKS、适用于 Lustre 的 Amazon FSx 和 Amazon Simple Storage Service(Amazon S3)。
-
推理优化
-
推理优化工具包使您可以轻松实施最新的推理优化技术,从而在 Amazon SageMaker 上实现最先进的(SOTA)性价比,同时节省数月的开发时间。您可以从 SageMaker 提供的常用优化技术菜单中进行选择,提前运行优化作业,对模型进行性能和精度指标基准测试,然后将优化的模型部署到 SageMaker 端点进行推断。
实例详细信息
Amazon SageMaker P5 实例产品详细信息
实例大小 | vCPU | 实例内存(TiB) | GPU 型号 | GPU | GPU 总内存(GB) | 每个 GPU 的内存(GB) | 网络带宽(Gbps) | GPUDirect RDMA | GPU 对等 | 实例存储(TB) | EBS 带宽(Gbps) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | 是 | 900 GB/s NVSwitch | 8 个 3.84 NVMe SSD | 80 |
Amazon SageMaker P4d 实例产品详细信息
实例大小 | vCPU | 实例内存(GiB) | GPU 型号 | GPU | GPU 总内存(GB) | 每个 GPU 的内存(GB) | 网络带宽(Gbps) | GPUDirect RDMA | GPU 对等 | 实例存储(GB) | EBS 带宽(Gbps) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA 和 EFA | 是 | 600 GB/s NVSwitch | 8 个 1000 NVMe SSD | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA 和 EFA | 是 | 600 GB/s NVSwitch | 8 个 1000 NVMe SSD | 19 |
Amazon SageMaker P3 实例产品详细信息
实例大小 | vCPU | 实例内存(GiB) | GPU 型号 | GPU | GPU 总内存(GB) | 每个 GPU 的内存(GB) | 网络带宽(Gbps) | GPU 对等 | 实例存储(GB) | EBS 带宽(Gbps) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | 最高 10 | 不适用 | 仅限 EBS | 1.5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | 仅限 EBS | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | 仅限 EBS | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 个 900 NVMeSSD | 19 |
Amazon SageMaker P2 实例产品详细信息
实例大小 | vCPU | 实例内存(GiB) | GPU 型号 | GPU | GPU 总内存(GB) | 每个 GPU 的内存(GB) | 网络带宽(Gbps) | EBS 带宽(Gbps) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | 最高 10 | 高 |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Amazon SageMaker G4 实例产品详细信息
实例大小 | vCPU | 实例内存(GiB) | GPU 型号 | GPU | GPU 总内存(GB) | 每个 GPU 的内存(GB) | 网络带宽(Gbps) | 实例存储(GB) | EBS 带宽(Gbps) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | 最高 25 | 1 个 125 NVMe SSD | 最高 3.5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | 最高 25 | 1 个 125 NVMe SSD | 最高 3.5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | 最高 25 | 1 个 125 NVMe SSD | 4.75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 个 900 NVMe SSD | 9.5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 个 900 NVMe SSD | 9.5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 个 900 NVMe SSD | 9.5 |
Amazon SageMaker G5 实例产品详细信息
实例大小 | vCPU | 实例内存(GiB) | GPU 型号 | GPU | GPU 总内存(GB) | 每个 GPU 的内存(GB) | 网络带宽(Gbps) | EBS 带宽(Gbps) | 实例存储(GB) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | 最高 10 | 最高 3.5 | 1x250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | 最高 10 | 最高 3.5 | 1x450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | 最高 25 | 8 | 1x600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2x3800 |
Amazon SageMaker Trn1 实例产品详细信息
实例大小 | vCPU | 内存 (GiB) | Trainium 加速器 | 加速器总内存(GB) | 每个加速器的内存(GB) | 实例存储 (GB) | 网络带宽(Gbps) | EBS 带宽(Gbps) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 个 500 NVMe SSD | 最高 12.5 | 最高 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 NVMe SSD | 800 | 80 |
Amazon SageMaker Inf1 实例产品详细信息
实例大小 | vCPU | 内存 (GiB) | Inferentia 加速器 | 加速器总内存(GB) | 每个加速器的内存(GB) | 实例存储 | 加速器间互连 | 网络带宽(Gbps) | EBS 带宽(Gbps) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | 仅限 EBS | 不适用 | 最高 25 | 最高 4.75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | 仅限 EBS | 不适用 | 最高 25 | 最高 4.75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | 仅限 EBS | 是 | 25 | 4.75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | 仅限 EBS | 是 | 100 | 19 |
Amazon SageMaker Inf2 实例产品详细信息
实例大小 | vCPU | 内存 (GiB) | Inferentia 加速器 | 加速器总内存(GB) | 每个加速器的内存(GB) | 实例存储 | 加速器间互连 | 网络带宽(Gbps) | EBS 带宽(Gbps) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | 仅限 EBS | 不适用 | 最高 25 | 最高 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | 仅限 EBS | 不适用 | 最高 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | 仅限 EBS | 是 | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | 仅限 EBS | 是 | 100 | 60 |
Amazon SageMaker Studio
Amazon SageMaker Studio 是一个基于 Web 的单一界面,适用于完整的机器学习开发,它提供完全托管的集成式开发环境(IDE)和专用工具供您选择。您可以免费访问 SageMaker Studio。您只需为 SageMaker Studio 中的不同 IDE 以及机器学习工具使用的底层计算和存储空间付费。
您可以使用来自 SageMaker Studio、适用于 Python 的 Amazon SDK(Boto3)或 AWS 命令行界面(AWS CLI)的许多服务,包括:
- SageMaker Studio 上的 DE 可通过一系列完全托管的 IDE 执行完整的 ML 开发,包括 JupyterLab、基于 Code-OSS(Visual Studio Code — 开源)的代码编辑器和 RStudio
- 使用 SageMaker Pipelines 来自动化和管理 ML 工作流程
- 使用 SageMaker Autopilot 来自动创建完全可视化的 ML 模型
- 使用 SageMaker Experiments 来整理与跟踪您的训练作业和版本
- 使用 SageMaker Debugger 来调试训练期间的异常
- 使用 SageMaker Model Monitor 来维持高质量模型
- 使用 SageMaker Clarify 来更好地解释您的 ML 模型并检测偏差
- 使用 SageMaker JumpStart 来轻松为多种使用案例部署 ML 解决方案。 对于 Amazon SageMaker 代表您执行的底层 API 调用,您可能会因解决方案中使用的其他 AWS 服务产生费用。
- 使用 SageMaker Inference Recommender 来获取有关正确端点配置的建议
您只需要根据自己的使用情况为 SageMaker 内的底层计算和存储资源或其他 AWS 服务付费。
要在 Jupyter Lab 和代码编辑器上使用 Amazon Q 开发者版免费套餐,请按照此处的说明进行操作。要在 Jupyter Lab 上使用 Amazon Q 开发者版专业套餐,必须订阅 Amazon Q 开发者版。Amazon Q 开发者版定价可在此处获得。
基础模型评测
SageMaker Clarify 支持使用自动和人工评估方法进行基础模型评估。每种方法都有不同的定价。如果您正在评估 Amazon SageMaker JumpStart 中尚未部署到您的账户的基础模型,SageMaker 将在推理期间临时在 SageMaker 实例上部署 JumpStart 模型。特定实例将符合 JumpStart 为该模型提供的实例建议。
自动评估:
基础模型评估作为 SageMaker 处理作业运行。评估作业将调用 SageMaker 推理。客户需要为推理和评估作业付费。客户只需为评估作业期间付费。评估作业的成本将是评估实例每小时成本的总和以及托管实例每小时成本的总和。
人工评估:
当您使用自带员工的基于人工的评估功能时,需要为三个项目付费:1) 用于推理的 SageMaker 实例,2) 用于运行托管人工评估的 SageMaker 处理作业的实例,以及 3 ) 完成的每个人工评估任务收费 0.21 美元。人工任务被定义为人力员工在人工评估用户界面中提交对单个提示及其相关推理响应的评估的事件。无论是是评估作业中有 1 到 2 个模型,还是自带推理,价格都是相同的,无论包含多少个评估维度和评级方法,价格也是相同的。每任务定价在所有 AWS 区域都相同,为 0.21 美元。由于员工是由您提供的,因此不向其单独收费。
AWS 管理的评估:
对于 AWS 管理的专家评估,我们会在与 AWS 专家评估团队合作的同时,通过私人参与的方式根据您的评估需求定制定价。
Amazon SageMaker Studio Lab
您可以免费使用 Amazon SageMaker Studio Lab构建和训练 ML 模型。 SageMaker Studio Lab 为开发人员、学者和数据科学家提供了一个无配置的开发环境,可以在其中免费学习和试验 ML。
Amazon SageMaker Canvas
Amazon SageMaker Canvas 通过为业务分析师提供使用可视化点击界面生成准确 ML 预测的能力,扩展了 ML 访问 - 无需编码或 ML 经验。
Amazon SageMaker Data Labeling
Amazon SageMaker Data Labeling 提供两种数据标注产品,Amazon SageMaker Ground Truth Plus 和 Amazon SageMaker Ground Truth。您可以了解关于 Amazon SageMaker Data Labeling 的更多信息,它是一种完全托管式数据标注服务,可让您轻松构建高度准确的训练数据集以用于 ML。
Amazon SageMaker 影子测试
SageMaker 通过针对当前部署的模型测试其性能,帮助您运行影子测试以在生产发布之前评估新的 ML 模型。对于预配置为托管影子模型的机器学习实例和存储,在使用量费用之外,进行 SageMaker 影子测试不额外收费。机器学习实例和存储维度的定价与前面定价表中注明的实时推理选项的定价相同。影子部署内外部处理的数据不额外收费。
Amazon SageMaker Edge
了解关于 Amazon SageMaker Edge 定价的更多信息,它可以在边缘设备队列上优化、运行与监控 ML 模型。
Amazon SageMaker Savings Plans
Amazon SageMaker Savings Plans 最高可帮助您节省 64% 的费用。这些计划会自动应用于符合条件的 SageMaker ML 实例用量,包括 SageMaker Studio Notebooks、SageMaker 笔记本实例、SageMaker 处理、SageMaker Data Wrangler、SageMaker 训练、SageMaker 实时推理和 SageMaker 批量转换,无论实例系列、大小或区域如何。例如,您可以随时将在美国东部(俄亥俄州)运行的 CPU 实例 ml.c5.xlarge 用量更改为在美国西部(俄勒冈州)运行的 ml.Inf1 实例用量以用于推理工作负载,并自动继续支付 Savings Plans 价格。
Amazon SageMaker 的总体拥有成本(TCO)
与其他基于云的自行管理的解决方案相比,Amazon SageMaker 在三年期间的总体拥有成本(TCO)至少降低 54%。通过 Amazon SageMaker 的完整 TCO 分析了解更多信息。
定价示例
-
定价示例 1:JupyterLab
作为一名数据科学家,您需要花 20 天的时间使用 JupyterLab 在 ml.g4dn.xlarge 实例上每天 6 小时对笔记本、代码和数据进行快速实验。您创建并运行 JupyterLab 空间以访问 JupyterLab IDE。仅对 JupyterLab 空间运行时使用的实例收取计算费用。JupyterLab 空间的存储费用会累积,直至被删除。计算
实例 持续时间 天数 总时长 每小时费用 合计 ml.g4dn.xlarge 6 小时 20 6 * 20 = 120 小时 0.7364 USD 88.368 USD 存储
您将使用通用固态硬盘存储 480 小时(24 小时 x 20 天)。在每月每 GB 收取 0.1125 USD 的区域:
每 GB 月 0.112 USD * 5GB * 480/(每天 24 小时 * 一个月 30 天)= 0.373 USD -
定价示例 2:代码编辑器
作为一名 ML 工程师,您需要花费 20 天时间在 ml.g4dn.xlarge 实例上使用代码编辑器进行 ML 生产代码编辑、执行和调试,每天 6 小时。您创建并运行代码编辑器空间以访问代码编辑器 IDE。仅对代码编辑器空间运行时使用的实例收取计算费用。代码编辑器空间的存储费用会累积,直至被删除。计算
实例 持续时间 天数 总时长 每小时费用 合计 ml.g4dn.xlarge 6 小时 20 6 * 20 = 120 小时 0.7364 USD 88.368 USD 存储
您将使用通用固态硬盘存储 480 小时(24 小时 x 20 天)。在每月每 GB 收取 0.1125 USD 的区域:
每 GB 月 0.112 USD * 5GB * 480/(每天 24 小时 * 一个月 30 天)= 0.373 USD
-
定价示例 3:Studio Classic
数据科学家在 Amazon SageMaker Studio Classic 中使用笔记本时按以下顺序执行操作。
- 在 ml.c5.xlarge 实例上的 TensorFlow 内核中打开笔记本 1,然后在此笔记本上工作 1 小时。
- 在 ml.c5.xlarge 实例上打开笔记本 2。该笔记本将在运行笔记本 1 的 ml.c5.xlarge 实例中自动打开。
- 同时在笔记本 1 和笔记本 2 上工作 1 小时。
- 数据科学家将为总计两 2 小时的 ml.c5.xlarge 使用时长付费。对于她同时在笔记本 1 和笔记本 2 上工作的重叠时间,将按 0.5 小时对每个内核应用程序计费,她将支付 1 小时的费用。
内核应用程序 笔记本实例 小时数 每小时费用 合计 TensorFlow ml.c5.xlarge 1 0.204 美元 0.204 美元 TensorFlow ml.c5.xlarge 0.5 0.204 美元 0.102 美元 数据科学 ml.c5.xlarge 0.5 0.204 美元 0.102 美元 0.408 美元 -
定价示例 4:RStudio
数据科学家在使用 RStudio 时按以下顺序执行操作:
- 在 ml.c5.xlarge 实例上启动 RSession 1,然后在此笔记本上工作 1 小时。
- 在 ml.c5.xlarge 实例上启动 RSession 2.该笔记本将在运行 RSession 1 的 ml.c5.xlarge 实例中自动打开。
- 同时在 RSession 1 和 RSession 2 上工作 1 小时。
- 数据科学家将为总计两 (2) 小时的 ml.c5.xlarge 使用时长付费。对于她同时在 RSession 1 和 RSession 2 上工作的重叠时间,将按 0.5 小时对每个 RSession 应用程序计费,她将支付 1 小时的费用。
同时,无论是否运行 RSessions,RServer 都全天候运行。如果管理员选择“小型”(ml.t3.medium),则为免费。如果管理员选择“中型”(ml.c5.4xlarge) 或“大型”(ml.c5.9xlarge),则只要为 SageMaker 域启用 RStudio,就会按小时收费。
RSession 应用程序 RSession 实例 小时数 每小时费用 合计 Base R ml.c5.xlarge 1 0.204 美元 0.204 美元 Base R ml.c5.xlarge 0.5 0.204 美元 0.102 美元 Base R ml.c5.xlarge 0.5 0.204 美元 0.102 美元 0.408 美元 -
定价示例 5:处理
Amazon SageMaker Processing 仅针对您在运行任务期间使用的实例收费。如果您用 Amazon S3 提供输入数据进行处理,则 Amazon SageMaker 会在处理任务开始时将数据从 Amazon S3 下载到本地文件存储。
该数据分析师在两个 ml.m5.4xlarge 实例上运行处理任务以便处理和验证数据,任务间隔时间为 10 分钟。她将 100GB 的数据集上传到 S3 中,作为处理任务的输入,而输出数据的大小与此大致相同,被传输回 S3 中。
小时数 处理实例 每小时费用 合计 1 * 2 * 0.167 = 0.334 ml.m5.4xlarge 0.922 USD 0.308 USD 通用型(SSD)存储(GB) 每小时费用 合计 100 GB * 2 = 200 0.14 USD 0.0032 USD Amazon SageMaker Processing 任务的费用小计 = 0.308 USD。
200GB 通用型 SSD 存储的费用小计 = 0.0032 USD。
此示例的费用合计为 0.3112 USD。
-
定价示例 6:Data Wrangler
从表中可以看出,为了准备数据,您在 3 天内使用 Amazon SageMaker Data Wrangler 的总时长为 18 个小时。此外,您还创建了一个 SageMaker Data Wrangler 作业,以便每周准备更新的数据。每个作业持续 40 分钟,作业在一个月内每周运行。
使用 Data Wrangler 的月度总费用 = 16.596 USD + 2.461 USD = 19.097 USD
应用程序 SageMaker Studio 实例 天数 持续时间 总时长 每小时费用 费用小计 SageMaker Data Wrangler ml.m5.4xlarge 3 6 小时 18 小时 0.922 USD 16.596 USD SageMaker Data Wrangler 作业 ml.m5.4xlarge - 40 分钟 2.67 小时 0.922 USD 2.461 USD 作为一名数据科学家,您要在三天内每天花 6 个小时使用 Amazon SageMaker Data Wrangler 来清理、探索和对您的数据进行可视化。然后,为了执行您的数据准备管道,您要启动计划每周运行的 SageMaker Data Wrangler 作业。
下表总结了您在当月的总使用量,以及与使用 Amazon SageMaker Data Wrangler 相关的费用。
-
定价示例 7:特征存放区
++ 所有小数读取单位都向上取整数
数据存储
总存储数据 = 31.5 GB
月度数据存储费用 = 31.5 GB * 0.45 USD = 14.175 USD月度 Amazon SageMaker Feature Store 总费用 = 56.875 USD + 3.185 USD + 14.175 USD = 74.235 USD
当月第几天 总写入数 总写入单位 总读取数 总读取单位 第 1 至 10 天 100000 次写入
(10000 次写入 * 10 天)2500000
(100000 * 25KB)100000
(10000 * 10 天)700000++
(100000 * 25/4KB)第 11 天 200000 次写入 5000000
(200000* 25KB)200000 次读取 1400000++
(200000* 25/4KB)第 12 至 30 天 1520000 次写入
(80000 * 19 天)38000000
(1520000 * 25KB)1520000 次写入
(80000 * 19 天)10640000++
(1520000 * 25/4KB)总应计费单位 45500000 个写入单位 12740000 个读取单位 月度写入和读取费用 56.875 USD
(4.55 千万个写入单位 * 每百万次写入 1.25 美元)3.185 USD
1274 万个读取单位 * 每百万次读取 0.25 USD)您有一个 Web 应用程序,它每次向 Amazon SageMaker Feature Store 发放 25KB 读取和写入。在一个月的前 10 天,流向您的应用程序的流量较少,每天产生对 SageMaker 特征存放区的 10000 次写入和 10000 次读取。在该月的第 11 天,您的应用程序受到社交媒体的关注,应用程序流量峰值在当天达到 200000 次写入和 200000 次读取。您的应用程序将进入更常规的流量模式,在接下来到月底的时间内,平均每天达到 80000 次写入和 80000 次读取。
下表总结了您在当月的总使用量,以及与使用 Amazon SageMaker Feature Store 相关的费用。
-
定价示例 8:训练
在本示例中,训练和调试的总费用为 2.38 USD。Amazon SageMaker Debugger 内置规则使用的计算实例和通用型存储卷不产生额外费用。
用于训练的通用型(SSD)存储(GB) 用于 Debugger 内置规则的通用型(SSD)存储(GB) 用于 Debugger 自定义规则的通用型(SSD)存储(GB) 每月每 GB 费用 费用小计 使用的容量 3 2 1 费用 0 USD 内置规则存储卷无额外费用 0 USD 0.10 USD 0 USD 小时数 训练实例 调试实例 每小时费用 费用小计 4 * 0.5 = 2.00 ml.m4.4xlarge 不适用 0.96 USD 1.92 USD 4 * 0.5 * 2 = 4 不适用 内置规则实例无额外费用 0 USD 0 USD 4 * 0.5 = 2 ml.m5.xlarge 不适用 0.23 USD 0.46 USD ------- 2.38 USD 一位数据科学家花了一周时间来为实验新想法建立模型。她在 ml.m4.4xlarge 上对模型进行了 4 次训练,每次训练 30 分钟,并且启用了 Amazon SageMaker Debugger,使用了 2 项内置规则和 1 项自己编写的自定义规则。对于自定义规则,她指定了 ml.m5.xlarge 实例。训练中使用了 3GB 位于 Amazon S3 中的训练数据,并将 1GB 模型输出推送到 Amazon S3 中。SageMaker 针对每个训练实例创建了通用型 SSD(gp2)卷。SageMaker 还针对指定的每项规则创建了通用型 SSD(gp2)卷。在本示例中一共创建了 4 个通用型 SSD(gp2)卷。SageMaker 调试程序将 1GB 的调试数据传送到客户的 Amazon S3 存储桶中。
-
定价示例 9:MLflow
您有两个数据科学家团队。一个团队由 10 名数据科学家组成,另一个团队由 40 名数据科学家组成。为了满足这两个团队的需求,您选择启用两个不同的 MLflow 跟踪服务器:一个小型,一个中型。这两个团队都在进行机器学习(ML)实验,需要记录其训练尝试产生的指标、参数和构件。他们希望每月使用 MLflow 跟踪服务器 160 小时。假设每个数据科学团队存储 1GB 的元数据来跟踪实验中的运行。月末的账单将按以下方式计算:
小型实例的计算费用:160 * 0.60 USD = 96 USD
中型实例的计算费用:160 * 1.40 USD = 166.4 USD
两个团队的存储费用:2 * 1 * 0.10 = 0.20 USD总费用 = 262.60 USD
-
定价示例 10:实时推理
训练、托管和监控的费用小计 = 305.827 USD。每月托管 3100MB 已处理的输入数据和 310MB 已处理的输出数据费用小计 = 0.054 USD。此示例的费用合计为 305.881 USD/月。
请注意,对于处理内置规则的 ml.m5.xlarge 实例,您每月可以免费获得长达 30 小时并且覆盖所有端点的免费监控时间。
每月输入数据 – 托管 每月输出数据 – 托管 每 GB 输入或输出费用 合计 100MB * 31 = 3100MB 0.016 USD 0.0496 USD 10MB * 31 = 310MB 0.016 USD 0.00496 USD 每月小时数 托管实例 模型监控实例 每小时费用 合计 24 * 31 * 2 = 1488 ml.c5.xlarge 0.204 美元 303.522 USD 31*0.08 = 2.5 ml.m5.4xlarge 0.922 USD 2.305 美元 示例 5 中的模型被部署到生产环境中的两(2)个 ml.c5.xlarge 实例上,用于实现可靠的多可用区托管。使用一(1)个 ml.m5.4xlarge 实例运行 Amazon SageMaker 模型监控器,每天运行一次监控任务。每次监控任务用时 5 分钟。该模型每日接收 100MB 数据,而推理则为输入数据大小的 1/10。
-
定价示例 11:异步推理
SageMaker 异步推理的费用小计 = 15.81 USD + 0.56 USD + 2 * 0.0048 = 16.38 USD。此示例的异步推理费用合计为 16.38 USD/月。
每月输入数据 每月输出数据 每 GB 输入或输出费用 合计 10KB * 1024 * 31 = 310MB 10KB * 1024 * 31 = 310MB 0.02 USD 0.0048 10KB * 1024 * 31 = 310MB 0.02 USD 0.0048 通用型(SSD)存储(GB) 每月每 GB 费用 合计 4 0.14 USD 0.56 USD 每月小时数 托管实例 每小时费用 合计 2.5 * 31 * 1 = 77.5 ml.c5.xlarge 0.20 USD 15.81 USD Amazon SageMaker 异步推理会针对您的端点所使用的实例向您收取费用。如果未积极处理请求,您可以配置自动扩展以扩缩实例数量到零,从而节省成本。对于 Amazon S3 中的输入负载,在相同区域内读取来自 Amazon S3 的输入数据和写入输出数据到 S3 不会产生费用。
示例 5 中的模型被用于运行 SageMaker 异步推理终端节点。终端节点被配置为在 1 个 ml.c5.xlarge 实例上运行,并在未积极处理请求时缩减实例数量到零。终端节点中的 ml.c5.xlarge 实例附有 4GB 通用型(SSD)存储。在此示例中,终端节点每天有 2 个小时维护的实例数量为 1,并有 30 分钟冷却时间,然后在一天当中的其他时间,它会缩减实例数量到零。因此,您要为每天的 2.5 个小时使用时间付费。
终端节点每天处理 1024 个请求。每个调用请求/回应正文的大小为 10KB,而且 Amazon S3 中的每个推理请求有效负载为 100MB。推理输出的大小是输入数据的 1/10,输入数据被重新存储到相同区域的 Amazon S3 当中。在此示例中,数据处理费用适用于请求和回应正文,但不适用于以 Amazon S3 为起点/终点的传输数据。
-
定价示例 12:批量转换
在此示例中,推断的总费用为 2.88 USD。
小时数 托管实例 每小时费用 合计 3 * 0.25 * 4 = 3 小时 ml.m4.4xlarge 0.96 USD 2.88 USD 示例 5 中的模型用于运行 SageMaker 批量转换。该数据科学家在 3 个 ml.m4.4xlarge 上运行四个独立的 SageMaker 批量转换任务,每个任务运行 15 分钟。她每次运行时估计在 S3 中上传 1GB 的数据集,而推理为输入数据(存储回 S3 的数据)的 1/10。
-
定价示例 13:按需无服务器推理
月度数据处理费用
数据处理 (GB) 每 GB 输入或输出费用 月度数据处理费用 10 GB 0.016 USD 0.16 USD SageMaker 无服务器按需推理持续时间费用的小计 = 40 USD。10GB 数据处理费用的小计 = 0.16 USD。此示例的费用合计为 40.16 USD。
月度计算费用
请求数量 每个请求的持续时间 总推理持续时间(秒) 每秒费用 月度推理持续时间费用 10 M 100ms 1M 0.00004 USD 40 USD
使用按需无服务器推理,您只需为用于处理推理请求的计算容量(按毫秒计费)和处理的数据量付费。计算费用取决于您选择的内存配置。
如果您为端点分配了 2GB 的内存,在一个月内执行了 1000 万次,每次运行时间为 100 毫秒,并且总共处理了 10GB 的数据输入/输出,那么您的费用将计算如下:
-
定价示例 14:无服务器推理上的预置并发
假设您正在为一家薪资处理公司运行聊天机器人服务。您预计在纳税申报截止日期之前的三月底,买家咨询量将激增。但是,在本月余下的时间里,预计流量将很低。因此,您可以部署一个具有 2GB 内存的无服务器端点,并且当月最后 5 天上午 9 点至下午 5 点(8 小时)的预置并发数为 100,在此期间,您的端点将处理 1000 万个请求和总计 10GB 的数据输入/输出。在本月剩余时间,聊天机器人将基于按需无服务器推理运行,处理 300 万个请求和 3GB 的数据输入/输出。让我们假设每个请求的持续时间为 100 毫秒。
预置并发 (PC) 费用
PC 价格为 0.000010 USD/秒
PC 使用时长(秒)= 5 天 * 100 台 PC * 8 小时 * 3600 秒 = 14400000 秒
PC 使用费 = 14400000 秒 * 0.000010 USD/ 秒 = 144 USD。预置并发所提供流量的推断持续时间费用
推理持续时间价格为 0.000023 USD/秒
PC 的总推理持续时间(秒)= 10M *(100 毫秒)/1000 = 1M 秒。
PC 的推理持续时间费用 = 1000000 秒 * 0.000023 USD/秒 = 23 USD按需推理时长费用
月度计算价格为 0.00004 USD/秒,免费套餐提供 150k 秒。
总计算(秒)= (3) M * (100 毫秒) /1000 = 0.3M 秒。
总计算 – 免费套餐计算 = 月度计费计算(秒)
0.3M 秒 — 150k 秒 = 150k 秒
月度计算费用 = 150k * 0.00004 USD = 6 USD数据处理
处理进/输出数据的成本/GB = 0.016 美元
处理的总千兆字节数 = 10+3 = 13
总成本 = 0.016 USD * 13 = 0.208 USD
三月的总费用
总费用 = 预置并发费用 + 预置并发的推断持续时间 + 按需计算的推断持续时间 + 数据处理费用
= 144 USD + 23 USD + 6 USD + 0.208 USD = 173.2 USD -
定价示例 15:JumpStart
客户使用 JumpStart 部署了一个经预先训练的 BERT Base Uncased 模型,用来将客户评价情绪分类为积极和消极两类。
客户将此模型部署到两(2)个 ml.c5.xlarge 实例上,以确保可靠的多可用区托管。该模型每日接收 100MB 数据,而推理则为输入数据大小的 1/10。
每月小时数 托管实例 每小时费用 合计 24 * 31 * 2 = 1488 ml.c5.xlarge 0.204 美元 303.55 美元 每月输入数据 – 托管 每月输出数据 – 托管 每 GB 输入或输出费用
合计
100MB * 31 = 3100MB 0.02 USD 0.06 USD 10MB * 31 = 310MB 0.02 USD 0.01 USD 训练、托管和监控的费用小计 = 305.827 USD。每月托管 3100MB 已处理的输入数据和 310MB 已处理的输出数据费用小计 = 0.06 USD。此示例的费用合计为 305.887 USD/月。
-
定价示例 16:HyperPod 集群
假设您想要配置一个由 4 个 ml.g5.24xlarge 组成的集群,为期 1 个月(30 天),并为每个实例额外提供 100GB 的存储空间来支持模型开发。 在此示例中,集群和额外存储的总费用为 29374.40 USD。计算
实例 持续时间 实例 每小时费用 费用小计 ml.g5.24xlarge 30 天 * 24 小时 = 720 小时 4 10.18 USD 29318.40 USD 存储
通用型(SSD)存储 持续时间 实例 每月每 GB 费用 费用小计 100 GB 30 天 * 24 小时 = 720 小时 4 0.14 USD 56.00 USD -
定价示例 17:基础模型评估(自动评估)
使用 SageMaker Clarify 进行的基础模型评估仅针对自动评估作业运行时使用的实例收取费用。当您选择自动评估任务和数据集时,SageMaker 会将提示数据集从 Amazon S3 加载到 SageMaker 评估实例上。
在以下示例中,ML 工程师对美国东部(弗吉尼亚州北部)的 Llama2 7B 模型进行了摘要任务准确性评估。Llama 2 7B 的推荐推理实例类型是 ml.g5.2xlarge。建议的最小评估实例为 ml.m5.2xlarge。在此示例中,作业运行 45 分钟(取决于数据集的大小)。在此示例中,评估作业和详细结果的成本为 1.48 美元。处理作业小时数(示例)
区域
实例类型
实例
每小时费用
费用
0.45
US-east-1
LLM 托管
ml.g5.2xlarge
1.52 USD
1.14 USD
0.45
US-east-1
评估
ml.m5.2xlarge
0.46 USD
0.35 USD
合计
1.48 USD
在下一个示例中,这位弗吉尼亚州的工程师运行了另一个摘要任务准确性评估作业,但使用的是 Llama 2 7B 的定制版本,该版本已部署到其账户,并且已启动并运行。在这种情况下,由于模型已部署到他们的账户,因此唯一的增量成本将是评估实例的成本。
处理作业小时数
区域
实例类型
实例
每小时费用
费用
0.45
US-east-1
评估
ml.m5.2xlarge
0.46 USD
0.35 USD
合计
0.35 USD
-
定价示例 18:基础模型评估(人工评估)
在以下示例中,美国东部(弗吉尼亚州北部)的一名机器学习工程师对 Llama-2-7B 进行了摘要任务准确性人工评估,并使用自己的专有员工来进行这项评估。Llama-2-7B 的推荐实例类型是 ml.g5.2xlarge。人工评估处理作业的建议最小实例是 ml.t3.medium。Llama-2-7B 上的推理运行 45 分钟(取决于数据集的大小)。该数据集包含 50 个提示,开发人员需要 2 个工作人员对每个提示响应集进行评分(可在评估作业创建中配置为“每个提示的工作人员”参数)。此评估作业中将有 100 个任务(每个工作人员的每个提示响应对有 1 个任务:2 个工作人员 x 50 个提示响应集 = 100 个人工任务)。人力需要一天(24 小时)才能完成评估作业中的所有 100 项人工评估任务(取决于工作人员的数量和技能水平,以及提示和推理响应的长度/复杂性)。
计算小时数
人工任务
区域
实例类型
实例
每小时费用
每项人工任务的成本
总成本
0.45
美国东部(弗吉尼亚州北部)
LLM 托管
ml.g5.2xlarge
1.52 USD
1.14 USD
24
美国东部(弗吉尼亚州北部)
处理作业
ml.t3.medium
0.05 USD
1.20 USD
100
任何
0.21 USD
21.00 USD
合计
23.34 USD
在下一个示例中,这位美国东部(弗吉尼亚州北部)工程师运行相同的评估任务,但使用的是 Llama-2-7B,该模型已经部署到他们的账户,并且已启动并运行。在这种情况下,唯一的增量成本将是评估处理作业和人工任务的成本。
计算小时数
人工任务
区域
实例类型
实例
每小时费用
每项人工任务的成本
总成本
24
美国东部(弗吉尼亚州北部)
处理作业
ml.t3.medium
0.05 USD
1.20 USD
100
任何
0.21 USD
21.00 USD
合计
22.20 USD