Amazon Bedrock 定价

定价概述

Amazon Bedrock 是一项完全托管的服务,可通过单个 API 提供多种高性能基础模型(FM),以及构建生成式人工智能应用程序所需的一系列广泛功能,通过安全性、隐私性和负责任的人工智能简化开发。

使用 Amazon Bedrock,您需要为模型的推理和自定义支付费用。有两种推理定价方案供您选择:1/ 按需和批量:此模式允许您按照即用即付的原则使用基础模型,无需承诺使用期限。2/ 预配置吞吐量:此模式允许您预先配置足够的吞吐量,以满足应用程序的性能要求,作为交换,您需要承诺使用期限。

定价模式

按需

在按需模式下,您只需按实际用量付费,无需承诺使用期限。对于文本生成模型,您需要为处理的每个输入令牌和生成的每个输出令牌付费。对于嵌入模型,您需要为处理的每个输入令牌付费。令牌由几个字符组成,是模型学习理解用户输入和提示的基本文本单位。对于图像生成模型,您需要为生成的每张图像付费。

批量

使用批量模式,您可以将一组提示作为单个输入文件提供,并将响应作为单个输出文件接收,这样就可以同时进行大规模预测。这些响应会被处理并存储在您的 Amazon S3 存储桶中,以便您稍后访问。批量模式的定价与按需模式的定价相同。

预配置吞吐量

使用预配置吞吐量模式,您可以为特定的基本模型或自定义模型购买模型单元。预配置吞吐量模式主要针对大规模、连续的推理工作负载,此类推理要求在吞吐量方面得到保障。您只能使用预配置吞吐量模式访问自定义模型。模型单元提供一定的吞吐量,吞吐量由每分钟处理的最大输入或输出令牌数衡量。预配置吞吐量定价方案按小时计费,您可以灵活地选择 1 个月或 6 个月的承诺期。

模型自定义

借助 Amazon Bedrock,您可以使用数据自定义 FM,提供针对特定任务和您的业务环境量身定制的响应。您可以使用标记数据微调模型,或使用未标记数据进行持续的预训练。对于自定义的文本生成模型,您需要按照模型处理的令牌总数(训练数据语料库中的令牌数量 x 训练周期数)支付模型训练费用,并每月为每个模型支付模型存储费用。训练周期是指在微调或持续的预训练过程中,对训练数据集的一次完整遍历。使用自定义模型的推理根据预配置吞吐量计划收费,并且需要您购买预配置吞吐量。在无承诺期的情况下,我们提供一个模型单元,供您处理自定义模型的推理。您需要按用于自定义模型推理的第一个模型单元的小时数付费。如果您想将吞吐量提高到一个模型单元以上,则必须购买 1 个月或 6 个月的承诺期。

无需额外付费即可进行构建的强大工具

使用 Amazon Bedrock 代理和 Amazon Bedrock 知识库时,您只需为与这些功能一起使用的模型和向量数据库付费。

定价明细

定价取决于模式、提供商和模型。请选择模型提供商以查看详细定价。

AI21 Labs

按需和批量定价

AI21 Labs 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

Jurassic-2 Mid

0.0125 美元

0.0125 美元

Jurassic-2 Ultra

0.0188 美元

0.0188 美元

目前,Amazon Bedrock 上的 AI21 Labs 模型不支持模型自定义(微调)和预配置吞吐量模式。

Amazon

区域

Anthropic

按需和批量定价

区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

Claude Instant

0.00080 美元

0.00240 美元

Claude 2.0/2.1

0.00800 美元

0.02400 美元

Claude 3 Opus*

0.01500 美元

0.07500 美元

Claude 3 Sonnet

0.00300 美元

0.01500 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

*Claude 3 Opus 目前在美国西部(俄勒冈州)区域提供。

区域:亚太地区(悉尼)

Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

Claude 3 Sonnet

0.00300 美元

0.01500 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

区域:欧洲地区(巴黎)

Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

Claude 3 Sonnet

0.00300 美元

0.01500 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

区域:亚太地区(东京)

Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

Claude Instant

0.00080 美元

0.00240 美元

Claude 2.0/2.1

0.00800 美元

0.02400 美元

区域:欧洲地区(法兰克福)

Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

Claude Instant

0.00080 美元

0.00240 美元

Claude 2.0/2.1

0.00800 美元

0.02400 美元

预配置吞吐量定价:

区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

Anthropic 模型 每个模型的每小时价格
无承诺期
1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

Claude Instant

44.00 USD

39.60 USD

22.00 美元

Claude 2.0/2.1

70.00 USD

63.00 USD

35.00 USD

Anthropic 模型 每个模型的每小时价格
无承诺期
1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

Claude Instant

44.00 USD

39.60 USD

22.00 美元

Claude 2.0/2.1

70.00 USD

63.00 USD

35.00 美元

区域:亚太地区(东京)

Anthropic 模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

Claude Instant

53.00 美元

29.00 美元

Claude 2.0/2.1

86.00 美元

48.00 美元

区域:欧洲地区(法兰克福)

Anthropic 模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

Claude Instant

49.00 美元

27.00 美元

Claude 2.0/2.1

79.00 美元

44.00 美元

请联系您的 AWS 账户团队,了解有关模型单元的更多详细信息。 

Cohere

按需和批量定价

Cohere 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格
命令 0.0015 美元 0.0020 美元
Command-Light 0.0003 美元 0.0006 美元
Embed – 英语 0.0001 美元 不适用
Embed – 多语言 0.0001 美元 不适用

定制(微调)的定价:

Cohere 模型 训练 1000 个令牌的价格 每个自定义模型每月的存储价格 自定义模型每个模型单元每小时推理的价格(无承诺预配置吞吐量定价)

Cohere Command

0.004 美元

1.95 美元

49.50 美元

Cohere Command-Light 0.001 美元

1.95 美元

8.56 美元

*训练的总令牌数 = 训练数据语料库中的令牌数量 x 训练周期数

预配置吞吐量定价:

Cohere 模型 每个模型的每小时价格 
无承诺期
1 个月承诺期内,每个模型单元的每小时价格

6 个月承诺期内,每个模型单元的每小时价格

Cohere Command

49.50 USD

39.60 USD

23.77 美元

Cohere Command-Light 8.56 USD

6.85 USD

4.11 USD
Embed — 英语 7.12 USD

6.76 USD

6.41 USD
Embed — 多语言 7.12 USD

6.76 USD

6.41 USD

请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。 

Meta Llama 2

按需和批量定价 

元模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

Llama 2 Chat (13B)

0.00075 美元

0.00100 美元

Llama 2 Chat (70B)

0.00195 美元

0.00256 美元

模型定制(微调)的定价:

元模型 训练 1000 个令牌的价格 每个自定义模型*每月的存储价格 自定义模型使用 1 个模型单元进行推理的每小时价格(无承诺期的预配置吞吐量定价)

Llama 2 预训练(13B)

0.00149 美元

1.95 美元

23.50 美元

Llama 2 预训练(70B)

0.00799 美元

1.95 美元 23.50 美元

*自定义模型存储空间 = 1.95 美元

预配置吞吐量定价:

元模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

Llama 2 预训练和聊天(13B)

21.18 美元

13.08 美元

Llama 2 预训练(70B)

21.18 美元

13.08 美元

*Llama 2 预训练模型仅在定制后的预配置吞吐量中可用。

请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。

Mistral AI

按需定价 —区域:美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)

Mistral AI 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格
Mistral 7B

0.00015 美元

0.0002 USD

Mixtral 8*7B

0.00045 USD

0.0007 USD
Mistral Large 0.008 USD 0.024 USD

按需定价 — 区域:欧洲地区(巴黎)、亚太地区(悉尼)

Mistral AI 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格
Mistral 7B

0.0002 USD

0.00026 USD

Mixtral 8*7B

0.00059 USD

0.00091 USD
Mistral Large 0.0104 USD 0.0312 USD
区域

Stability AI

按需和批量定价

Stability AI 提供的图像模型按图像定价,具体取决于步数和图像分辨率:

Stability AI 模型 图像分辨率 生成每张高质量图像的价格(<=50 步) 生成每张高质量图像的价格(>50 步)

 

SDXL 0.8

512 x 512 或更小

每张图像 0.018 美元

每张图像 0.036 美元

大于 512 x 512

每张图像 0.036 美元

每张图像 0.072 美元

SDXL 1.0

最多 1024 x 1024

0.04 美元 0.08 美元

预配置吞吐量定价:

Stability AI 模型 1 个月承诺期内,每个模型单元的每小时价格* 6 个月承诺期内,每个模型单元的每小时价格*

SDXL 1.0

49.86 美元

46.18 美元

*包含基础模型和自定义模型的推理。

请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。

目前,Amazon Bedrock 上的 Stability AI 模型不支持模型自定义(微调)。

定价示例

  • 应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 AI21 的 Jurrasic-2 Mid 模型将 1 万个令牌的输入文本总结成 2 千个令牌的输出。

    产生的总成本 = 1 万个令牌/1000 * 0.0125 美元 + 2 千个令牌/1000 * 0.0125 美元 = 0.15 美元

  • 按需定价

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Amazon Titan Text – Lite 模型将 2 千个令牌的输入文本总结成 1 千个令牌的输出。

    每小时产生的总成本为 = 2 千个令牌/1000 * 0.0003 美元 + 1 千个令牌/1000 * 0.0004 美元 = 0.001 美元。

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Titan 图像生成器基础模型生成 1000 张大小为 1024 x 1024 的标准质量图像

    产生的总成本 = 1000 张图像 * 每张图像 0.01 美元 = 10 美元

    定制(微调和持续预训练)定价

    应用程序开发人员使用 1000 个图像文本对自定义 Titan 图像生成模型。训练结束后,开发人员使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。

    微调产生的每月成本为:微调训练(0.005 美元 * 500 * 64),其中 0.005 美元是每张图像的价格,500 是步骤数,64 是批量大小 + 每月自定义模型存储(1.95 美元)+ 一小时的自定义模型推理(21 美元)= 160 美元 + 1.95 美元 + 21 = 182.95 美元

    预配置吞吐量定价

    应用程序开发人员购买了两个 Titan Text Express 模型单元,用于处理文本摘要,承诺期为 1 个月。

    每月产生的总成本 = 2 个模型单元 * 18.40 美元/小时 * 24 小时 * 31 天 = 27379.20 美元

    应用程序开发人员购买了一个基本 Titan 图像生成器模型的模型单元,承诺期为 1 个月。

    产生的总成本 = 1 * 16.20 美元 * 24 小时 * 31 天 = 12052.80 美元

  • 按需定价

    应用程序开发人员在美国西部(俄勒冈州)对 Amazon Bedrock 执行了以下 API 调用:请求 Anthropic 的 Claude 模型将 1.1 万个令牌的输入文本总结成 4 千个令牌的输出。

    产生的总成本 = 1.1 万个令牌/1000 * 0.008 美元 + 4 千个令牌/1000 * 0.024 美元 = 0.088 美元 + 0.096 美元 = 0.184 美元

    预配置吞吐量定价

    一位应用程序开发人员在美国西部(俄勒冈州)区域购买了 Anthropic Claude Instant 的一个模型单元:

    每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元

  • 按需定价

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command 模型将 6 千个令牌的输入文本总结成 2 千个令牌的输出。

    产生的总成本 = 6 千个令牌/1000 * 0.00150 美元 + 2 千个令牌/1000 * 0.0020 美元 = 0.013 美元

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command-Light 模型将 6 千个令牌的输入文本总结成 2 千个令牌的输出。

    产生的总成本 = 6 千个令牌/1000 * 0.0003 美元 + 2 千个令牌/1000 * 0.0006 美元 = 0.003 美元

    应用程序开发人员对 Amazon Bedrock 进行了以下 API 调用:请求 Cohere 的 Embed 英语或多语言模型为 1 万个输入令牌生成嵌入。

    产生的总成本为 = 1 万个令牌/1000 * 0.0001 美元 = 0.001 美元

    自定义(微调)定价

    应用程序开发人员使用 1000 个数据令牌自定义 Cohere 命令模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。

    每月微调产生的费用为:微调训练(0.004 美元 x 1000)+ 每月自定义模型存储空间(1.95 美元)+ 一小时的自定义模型推理(49.50 美元)= 55.45 美元

    自定义模型的预配置吞吐量(1 个月承诺期)产生的每月成本 = 39.60 美元

    预配置吞吐量定价

    应用程序开发人员购买了一个 Cohere Command 模型单元,用于处理文本摘要,承诺期为 1 个月。

    每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元

  • 按需定价

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Meta 的 Llama 2 Chat(13B)模型将 2000 个令牌的输入文本总结成 500 个令牌的输出。

    产生的总成本为 = 2 千个令牌/1000 * 0.00075 美元 + 500 个令牌/1000 * 0.001 美元 = 0.002 美元

    自定义(微调)定价

    应用程序开发人员使用 1000 个数据令牌自定义 Llama 2 预训练(70B)模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。

    每月微调产生的费用为:微调训练(0.00799 美元 x 1000)+ 每月自定义模型存储空间(1.95 美元)+ 一小时的自定义模型推理(23.50 美元)= 33.44 美元

    自定义模型的预配置吞吐量(1 个月承诺期)产生的每月成本 = 21.18 美元

    预配置吞吐量定价

    应用程序开发人员购买了一个 Meta Llama 2 模型单元,用于处理文本摘要,承诺期为 1 个月。

    每月产生的总成本 = 1 个模型单元 * 21.20 美元 * 24 小时 * 31 天 = 15772.8 美元

  • 按需定价

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral 7B 模型将 2 千个令牌的输入文本总结成 1 千个令牌的输出。

    每小时产生的总成本为 = 2 千个令牌/1000 * 0.00015 美元 + 1 千个令牌/1000 * 0.0002 美元 = 0.0005 美元

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mixtral 8x7B 模型将 2 千个令牌的输入文本总结成 1 千个令牌的输出。

    每小时产生的总成本为 = 2000 个令牌/1000 * 0.00045 美元 + 1000 个令牌/1000 * 0.0007 美元 = 0.0016 美元

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral Large 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。 

    每小时产生的总成本为 = 2000 个令牌/1000 * 0.008 美元 + 1000 个令牌/1000 * 0.024 美元 = 0.04 美元

  • 按需定价

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL 模型生成尺寸为 512 x 512 的图像,步数为 70(高质量)

    产生的总成本 = 1 张图像 * 每张图像 0.036 美元 = 0.036 美元

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL1.0 模型生成尺寸为 1024 x 1024 的图像,步数为 70(高质量)

    产生的总成本 = 1 张图像 * 每张图像 0.08 美元 = 0.08 美元

    预配置吞吐量定价

    应用程序开发人员购买了一个 SDXL1.0 模型单元,承诺期为 1 个月。

    产生的总成本 = 1 * 49.86 美元 * 24 小时 * 31 天 = 37,095.84 美元