Amazon Bedrock 定价
定价概述
Amazon Bedrock 是一项完全托管的服务,可通过单个 API 提供多种高性能基础模型(FM),以及构建生成式人工智能应用程序所需的一系列广泛功能,通过安全性、隐私性和负责任的人工智能简化开发。
使用 Amazon Bedrock,您需要为模型的推理和自定义支付费用。有两种推理定价方案供您选择:1/ 按需和批量:此模式允许您按照即用即付的原则使用基础模型,无需承诺使用期限。2/ 预配置吞吐量:此模式允许您预先配置足够的吞吐量,以满足应用程序的性能要求,作为交换,您需要承诺使用期限。
定价模式
按需
在按需模式下,您只需按实际用量付费,无需承诺使用期限。对于文本生成模型,您需要为处理的每个输入令牌和生成的每个输出令牌付费。对于嵌入模型,您需要为处理的每个输入令牌付费。令牌由几个字符组成,是模型学习理解用户输入和提示的基本文本单位。对于图像生成模型,您需要为生成的每张图像付费。
批量
使用批量模式,您可以将一组提示作为单个输入文件提供,并将响应作为单个输出文件接收,这样就可以同时进行大规模预测。这些响应会被处理并存储在您的 Amazon S3 存储桶中,以便您稍后访问。批量模式的定价与按需模式的定价相同。
预配置吞吐量
使用预配置吞吐量模式,您可以为特定的基本模型或自定义模型购买模型单元。预配置吞吐量模式主要针对大规模、连续的推理工作负载,此类推理要求在吞吐量方面得到保障。您只能使用预配置吞吐量模式访问自定义模型。模型单元提供一定的吞吐量,吞吐量由每分钟处理的最大输入或输出令牌数衡量。预配置吞吐量定价方案按小时计费,您可以灵活地选择 1 个月或 6 个月的承诺期。
模型自定义
借助 Amazon Bedrock,您可以使用数据自定义 FM,提供针对特定任务和您的业务环境量身定制的响应。您可以使用标记数据微调模型,或使用未标记数据进行持续的预训练。对于自定义的文本生成模型,您需要按照模型处理的令牌总数(训练数据语料库中的令牌数量 x 训练周期数)支付模型训练费用,并每月为每个模型支付模型存储费用。训练周期是指在微调或持续的预训练过程中,对训练数据集的一次完整遍历。使用自定义模型的推理根据预配置吞吐量计划收费,并且需要您购买预配置吞吐量。在无承诺期的情况下,我们提供一个模型单元,供您处理自定义模型的推理。您需要按用于自定义模型推理的第一个模型单元的小时数付费。如果您想将吞吐量提高到一个模型单元以上,则必须购买 1 个月或 6 个月的承诺期。
无需额外付费即可进行构建的强大工具
使用 Amazon Bedrock 代理和 Amazon Bedrock 知识库时,您只需为与这些功能一起使用的模型和向量数据库付费。
定价明细
定价取决于模式、提供商和模型。请选择模型提供商以查看详细定价。
AI21 Labs
按需和批量定价
AI21 Labs 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Jurassic-2 Mid |
0.0125 美元 |
0.0125 美元 |
Jurassic-2 Ultra |
0.0188 美元 |
0.0188 美元 |
目前,Amazon Bedrock 上的 AI21 Labs 模型不支持模型自定义(微调)和预配置吞吐量模式。
Amazon
Anthropic
按需和批量定价
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
Anthropic 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Claude Instant |
0.00080 美元 |
0.00240 美元 |
Claude 2.0/2.1 |
0.00800 美元 |
0.02400 美元 |
Claude 3 Opus* |
0.01500 美元 |
0.07500 美元 |
Claude 3 Sonnet |
0.00300 美元 |
0.01500 USD |
Claude 3 Haiku |
0.00025 USD |
0.00125 USD |
*Claude 3 Opus 目前在美国西部(俄勒冈州)区域提供。 |
区域:亚太地区(悉尼)
Anthropic 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Claude 3 Sonnet |
0.00300 美元 |
0.01500 USD |
Claude 3 Haiku |
0.00025 USD |
0.00125 USD |
区域:欧洲地区(巴黎)
Anthropic 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Claude 3 Sonnet |
0.00300 美元 |
0.01500 USD |
Claude 3 Haiku |
0.00025 USD |
0.00125 USD |
区域:亚太地区(东京)
Anthropic 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Claude Instant |
0.00080 美元 |
0.00240 美元 |
Claude 2.0/2.1 |
0.00800 美元 |
0.02400 美元 |
区域:欧洲地区(法兰克福)
Anthropic 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Claude Instant |
0.00080 美元 |
0.00240 美元 |
Claude 2.0/2.1 |
0.00800 美元 |
0.02400 美元 |
预配置吞吐量定价:
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
Anthropic 模型 | 每个模型的每小时价格 无承诺期 |
1 个月承诺期内,每个模型单元的每小时价格 | 6 个月承诺期内,每个模型单元的每小时价格 |
Claude Instant |
44.00 USD | 39.60 USD |
22.00 美元 |
Claude 2.0/2.1 |
70.00 USD | 63.00 USD |
35.00 USD |
Anthropic 模型 | 每个模型的每小时价格 无承诺期 |
1 个月承诺期内,每个模型单元的每小时价格 | 6 个月承诺期内,每个模型单元的每小时价格 |
Claude Instant |
44.00 USD | 39.60 USD |
22.00 美元 |
Claude 2.0/2.1 |
70.00 USD | 63.00 USD |
35.00 美元 |
区域:亚太地区(东京)
Anthropic 模型 | 1 个月承诺期内,每个模型单元的每小时价格 | 6 个月承诺期内,每个模型单元的每小时价格 |
Claude Instant |
53.00 美元 |
29.00 美元 |
Claude 2.0/2.1 |
86.00 美元 |
48.00 美元 |
区域:欧洲地区(法兰克福)
Anthropic 模型 | 1 个月承诺期内,每个模型单元的每小时价格 | 6 个月承诺期内,每个模型单元的每小时价格 |
Claude Instant |
49.00 美元 |
27.00 美元 |
Claude 2.0/2.1 |
79.00 美元 |
44.00 美元 |
请联系您的 AWS 账户团队,了解有关模型单元的更多详细信息。
Cohere
按需和批量定价
Cohere 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
命令 | 0.0015 美元 | 0.0020 美元 |
Command-Light | 0.0003 美元 | 0.0006 美元 |
Embed – 英语 | 0.0001 美元 | 不适用 |
Embed – 多语言 | 0.0001 美元 | 不适用 |
定制(微调)的定价:
Cohere 模型 | 训练 1000 个令牌的价格 | 每个自定义模型每月的存储价格 | 自定义模型每个模型单元每小时推理的价格(无承诺预配置吞吐量定价) |
Cohere Command |
0.004 美元 |
1.95 美元 |
49.50 美元 |
Cohere Command-Light | 0.001 美元 | 1.95 美元 |
8.56 美元 |
*训练的总令牌数 = 训练数据语料库中的令牌数量 x 训练周期数
预配置吞吐量定价:
Cohere 模型 | 每个模型的每小时价格 无承诺期 |
1 个月承诺期内,每个模型单元的每小时价格 | 6 个月承诺期内,每个模型单元的每小时价格 |
Cohere Command |
49.50 USD | 39.60 USD |
23.77 美元 |
Cohere Command-Light | 8.56 USD | 6.85 USD |
4.11 USD |
Embed — 英语 | 7.12 USD | 6.76 USD |
6.41 USD |
Embed — 多语言 | 7.12 USD | 6.76 USD |
6.41 USD |
请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。
Meta Llama 2
按需和批量定价
元模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Llama 2 Chat (13B) |
0.00075 美元 |
0.00100 美元 |
Llama 2 Chat (70B) | 0.00195 美元 |
0.00256 美元 |
模型定制(微调)的定价:
元模型 | 训练 1000 个令牌的价格 | 每个自定义模型*每月的存储价格 | 自定义模型使用 1 个模型单元进行推理的每小时价格(无承诺期的预配置吞吐量定价) |
Llama 2 预训练(13B) |
0.00149 美元 |
1.95 美元 |
23.50 美元 |
Llama 2 预训练(70B) | 0.00799 美元 |
1.95 美元 | 23.50 美元 |
*自定义模型存储空间 = 1.95 美元
预配置吞吐量定价:
元模型 | 1 个月承诺期内,每个模型单元的每小时价格 | 6 个月承诺期内,每个模型单元的每小时价格 |
Llama 2 预训练和聊天(13B) |
21.18 美元 |
13.08 美元 |
Llama 2 预训练(70B) | 21.18 美元 |
13.08 美元 |
*Llama 2 预训练模型仅在定制后的预配置吞吐量中可用。
请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。
Mistral AI
按需定价 —区域:美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)
Mistral AI 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Mistral 7B | 0.00015 美元 |
0.0002 USD |
Mixtral 8*7B | 0.00045 USD |
0.0007 USD |
Mistral Large | 0.008 USD | 0.024 USD |
按需定价 — 区域:欧洲地区(巴黎)、亚太地区(悉尼)
Mistral AI 模型 | 每 1000 个输入令牌的价格 | 每 1000 个输出令牌的价格 |
Mistral 7B | 0.0002 USD |
0.00026 USD |
Mixtral 8*7B | 0.00059 USD |
0.00091 USD |
Mistral Large | 0.0104 USD | 0.0312 USD |
Stability AI
按需和批量定价
Stability AI 提供的图像模型按图像定价,具体取决于步数和图像分辨率:
Stability AI 模型 | 图像分辨率 | 生成每张高质量图像的价格(<=50 步) | 生成每张高质量图像的价格(>50 步) |
SDXL 0.8 |
512 x 512 或更小 |
每张图像 0.018 美元 |
每张图像 0.036 美元 |
大于 512 x 512 |
每张图像 0.036 美元 |
每张图像 0.072 美元 |
|
SDXL 1.0 | 最多 1024 x 1024 |
0.04 美元 | 0.08 美元 |
预配置吞吐量定价:
Stability AI 模型 | 1 个月承诺期内,每个模型单元的每小时价格* | 6 个月承诺期内,每个模型单元的每小时价格* |
SDXL 1.0 |
49.86 美元 |
46.18 美元 |
*包含基础模型和自定义模型的推理。
请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。
目前,Amazon Bedrock 上的 Stability AI 模型不支持模型自定义(微调)。
定价示例
-
AI21 labs
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 AI21 的 Jurrasic-2 Mid 模型将 1 万个令牌的输入文本总结成 2 千个令牌的输出。
产生的总成本 = 1 万个令牌/1000 * 0.0125 美元 + 2 千个令牌/1000 * 0.0125 美元 = 0.15 美元
-
Amazon
按需定价
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Amazon Titan Text – Lite 模型将 2 千个令牌的输入文本总结成 1 千个令牌的输出。
每小时产生的总成本为 = 2 千个令牌/1000 * 0.0003 美元 + 1 千个令牌/1000 * 0.0004 美元 = 0.001 美元。
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Titan 图像生成器基础模型生成 1000 张大小为 1024 x 1024 的标准质量图像
产生的总成本 = 1000 张图像 * 每张图像 0.01 美元 = 10 美元
定制(微调和持续预训练)定价
应用程序开发人员使用 1000 个图像文本对自定义 Titan 图像生成模型。训练结束后,开发人员使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。
微调产生的每月成本为:微调训练(0.005 美元 * 500 * 64),其中 0.005 美元是每张图像的价格,500 是步骤数,64 是批量大小 + 每月自定义模型存储(1.95 美元)+ 一小时的自定义模型推理(21 美元)= 160 美元 + 1.95 美元 + 21 = 182.95 美元
预配置吞吐量定价
应用程序开发人员购买了两个 Titan Text Express 模型单元,用于处理文本摘要,承诺期为 1 个月。
每月产生的总成本 = 2 个模型单元 * 18.40 美元/小时 * 24 小时 * 31 天 = 27379.20 美元
应用程序开发人员购买了一个基本 Titan 图像生成器模型的模型单元,承诺期为 1 个月。
产生的总成本 = 1 * 16.20 美元 * 24 小时 * 31 天 = 12052.80 美元
-
Anthropic
按需定价
应用程序开发人员在美国西部(俄勒冈州)对 Amazon Bedrock 执行了以下 API 调用:请求 Anthropic 的 Claude 模型将 1.1 万个令牌的输入文本总结成 4 千个令牌的输出。
产生的总成本 = 1.1 万个令牌/1000 * 0.008 美元 + 4 千个令牌/1000 * 0.024 美元 = 0.088 美元 + 0.096 美元 = 0.184 美元
预配置吞吐量定价
一位应用程序开发人员在美国西部(俄勒冈州)区域购买了 Anthropic Claude Instant 的一个模型单元:
每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元
-
Cohere
按需定价
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command 模型将 6 千个令牌的输入文本总结成 2 千个令牌的输出。
产生的总成本 = 6 千个令牌/1000 * 0.00150 美元 + 2 千个令牌/1000 * 0.0020 美元 = 0.013 美元
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command-Light 模型将 6 千个令牌的输入文本总结成 2 千个令牌的输出。
产生的总成本 = 6 千个令牌/1000 * 0.0003 美元 + 2 千个令牌/1000 * 0.0006 美元 = 0.003 美元
应用程序开发人员对 Amazon Bedrock 进行了以下 API 调用:请求 Cohere 的 Embed 英语或多语言模型为 1 万个输入令牌生成嵌入。
产生的总成本为 = 1 万个令牌/1000 * 0.0001 美元 = 0.001 美元
自定义(微调)定价
应用程序开发人员使用 1000 个数据令牌自定义 Cohere 命令模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。
每月微调产生的费用为:微调训练(0.004 美元 x 1000)+ 每月自定义模型存储空间(1.95 美元)+ 一小时的自定义模型推理(49.50 美元)= 55.45 美元
自定义模型的预配置吞吐量(1 个月承诺期)产生的每月成本 = 39.60 美元
预配置吞吐量定价
应用程序开发人员购买了一个 Cohere Command 模型单元,用于处理文本摘要,承诺期为 1 个月。
每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元
-
元数据
按需定价
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Meta 的 Llama 2 Chat(13B)模型将 2000 个令牌的输入文本总结成 500 个令牌的输出。
产生的总成本为 = 2 千个令牌/1000 * 0.00075 美元 + 500 个令牌/1000 * 0.001 美元 = 0.002 美元
自定义(微调)定价
应用程序开发人员使用 1000 个数据令牌自定义 Llama 2 预训练(70B)模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。
每月微调产生的费用为:微调训练(0.00799 美元 x 1000)+ 每月自定义模型存储空间(1.95 美元)+ 一小时的自定义模型推理(23.50 美元)= 33.44 美元
自定义模型的预配置吞吐量(1 个月承诺期)产生的每月成本 = 21.18 美元
预配置吞吐量定价
应用程序开发人员购买了一个 Meta Llama 2 模型单元,用于处理文本摘要,承诺期为 1 个月。
每月产生的总成本 = 1 个模型单元 * 21.20 美元 * 24 小时 * 31 天 = 15772.8 美元
-
Mistral AI
按需定价
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral 7B 模型将 2 千个令牌的输入文本总结成 1 千个令牌的输出。
每小时产生的总成本为 = 2 千个令牌/1000 * 0.00015 美元 + 1 千个令牌/1000 * 0.0002 美元 = 0.0005 美元
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mixtral 8x7B 模型将 2 千个令牌的输入文本总结成 1 千个令牌的输出。
每小时产生的总成本为 = 2000 个令牌/1000 * 0.00045 美元 + 1000 个令牌/1000 * 0.0007 美元 = 0.0016 美元
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral Large 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。
每小时产生的总成本为 = 2000 个令牌/1000 * 0.008 美元 + 1000 个令牌/1000 * 0.024 美元 = 0.04 美元
-
Stability AI
按需定价
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL 模型生成尺寸为 512 x 512 的图像,步数为 70(高质量)
产生的总成本 = 1 张图像 * 每张图像 0.036 美元 = 0.036 美元
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL1.0 模型生成尺寸为 1024 x 1024 的图像,步数为 70(高质量)
产生的总成本 = 1 张图像 * 每张图像 0.08 美元 = 0.08 美元
预配置吞吐量定价
应用程序开发人员购买了一个 SDXL1.0 模型单元,承诺期为 1 个月。
产生的总成本 = 1 * 49.86 美元 * 24 小时 * 31 天 = 37,095.84 美元