Amazon Bedrock

Amazon Bedrock 定价

开始免费使用

请求报价

模型定价

模型定价

定价取决于模态、提供商和模型。请选择模型提供商以查看详细定价。

Amazon Bedrock 支持各种套餐，包括标准、弹性、优先级和预留套餐。点击了解有关服务套餐的更多信息。

Amazon Bedrock 提供来自领先人工智能提供商（如 Anthropic、Meta、Mistral AI 和 Amazon）的精选基础模型（FM），用于批量推理，价格比按需推理定价低 50%。要了解有关批量的更多信息，请单击此处的。请参阅此处的模型列表。

AI21 Labs
AI21 Labs

按需定价
Amazon
- Amazon Nova
- Amazon Titan
- 其他 Amazon
- Amazon Nova
- Amazon Nova
  
  理解模型的定价
  
  全球跨区域推理
  
  地理跨区域推理和区域内推理
  
  内置工具
  
  创意内容生成模型的定价
  
  语音理解和生成模型的定价
  
  语音转语音基础模型的按需定价
  
  注意：* 文本 token 的输入和输出定价适用于特定的使用案例，例如语音转文本转录、用于完成任务或构建知识基础的工具调用、向会话中添加对话历史记录等等。
  
  自定义 Nova 模型的按需推理定价也与基础 Nova 模型的推理定价一致。
  
  嵌入模型的定价
- Amazon Titan
- Amazon Titan
- 其他 Amazon
Anthropic

Anthropic

按需和批量定价

具有扩展访问权限的模型

提供商	模型名称	区域	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格	每 100 万个输入 token（批量）的价格	每 100 万个输出 token（批量）的价格	每 100 万个输入 token（缓存写入）的价格	每 100 万个输入 token（缓存读取）的价格
Anthropic	Claude 3.5 Sonnet（公共扩展访问权限，2025 年 12 月 1 日生效）	美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）、美国西部（俄勒冈州）、欧洲地区（法兰克福）、欧洲地区（爱尔兰）、欧洲（苏黎世）、欧洲地区（巴黎）	6.00 USD	30.00 USD	3.00 USD	15.00 USD	不适用	不适用
Anthropic	Claude 3.5 Sonnet v2（公共扩展访问权限，2025 年 12 月 1 日生效）	美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）、美国西部（俄勒冈州）	6.00 USD	30.00 USD	3.00 USD	15.00 USD	7.50 USD	0.60 USD

预留套餐定价

延迟优化推理

预置吞吐量定价

有关预置吞吐量的定价，请联系您的客户团队。

Cohere

Cohere

按需定价

Cohere 模型	每 1000 个查询的价格**
Rerank 3.5	2.00 USD
**一个查询中最多可以包含 100 个文档块的大量查询需要付费。如果查询包含超过 100 个文档块，则将其计为多个查询。例如，如果请求包含 350 个文档，则会被视为 4 个查询。请注意，每个文档最多只能包含 500 个令牌（包括查询和文档的总令牌数），如果令牌长度大于 512 个令牌，则将其分解为多个文档。

定制（微调）的定价

*训练的 token 总数 = 训练数据语料库中的 token 数量 x 训练周期数

预配置吞吐量定价

Cohere 模型	每个模型的每小时价格无承诺期	1 个月承诺期内，每个模型单元的每小时价格	6 个月承诺期内，每个模型单元的每小时价格
Cohere Command	49.50 USD	39.60 USD	23.77 USD
Cohere Command - Light	8.56 USD	6.85 USD	4.11 USD
Embed 3 英文	7.12 USD	6.76 USD	6.41 USD
Embed 3 多语言	7.12 USD	6.76 USD	6.41 USD

请联系您的 AWS 账户或销售团队，了解有关模型单元的更多详细信息。

DeepSeek

DeepSeek

按需定价

标准
优先级
弹性

标准

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

DeepSeek 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
DeepSeek v3.2	0.62 USD	1.85 USD

区域：亚太地区（孟买）、南美洲（圣保罗）、亚太地区（雅加达）、亚太地区（东京）和欧洲地区（斯德哥尔摩）

DeepSeek 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
DeepSeek v3.2	0.74 USD	2.22 USD

区域：亚太地区（悉尼）

DeepSeek 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
DeepSeek v3.1	0.5974 USD	1.7304 USD
DeepSeek v3.2	0.6386 USD	1.9055 USD

优先级

区域：亚太地区（悉尼）

DeepSeek 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
DeepSeek v3.1	1.0455 USD	3.0282 USD

弹性

区域：亚太地区（悉尼）

DeepSeek 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
DeepSeek v3.1	0.2987 USD	0.8652 USD

Google

Google

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

Google 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Gemma 3 4B	0.04 USD	0.08 USD
Gemma 3 12B	0.09 USD	0.29 USD
Gemma 3 27B	0.23 USD	0.38 USD

区域：亚太地区（孟买）、欧洲地区（爱尔兰）和欧洲地区（米兰）

Google 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Gemma 3 4B	0.05 USD	0.09 USD
Gemma 3 12B	0.11 USD	0.34 USD
Gemma 3 27B	0.27 USD	0.45 USD

区域：南美洲（圣保罗）和亚太地区（东京）

Google 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Gemma 3 4B	0.05 USD	0.10 USD
Gemma 3 12B	0.11 USD	0.35 USD
Gemma 3 27B	0.28 USD	0.46 USD

区域：欧洲地区（伦敦）

Google 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Gemma 3 4B	0.06 USD	0.12 USD
Gemma 3 12B	0.14 USD	0.45 USD
Gemma 3 27B	0.36 USD	0.59 USD

区域：亚太地区（悉尼）

Google 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Gemma 3 4B	0.0412 USD	0.0824 USD
Gemma 3 12B	0.0927 USD	0.2987 USD
Gemma 3 27B	0.2369 USD	0.3914 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐的定价比标准套餐的定价享受 50% 的折扣

Luma AI
按需定价
Meta

MiniMax AI

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

Minimax 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
MiniMax M2	0.30 USD	1.20 USD
Minimax M2.1	0.30 USD	1.20 USD

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

Minimax 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Minimax M2.5	0.30 USD	1.20 USD

区域：亚太地区（孟买）、欧洲地区（爱尔兰）和欧洲地区（米兰）

Minimax 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
MiniMax M2	0.35 USD	1.41 USD
Minimax M2.1	0.36 USD	1.44 USD

区域：南美洲（圣保罗）和亚太地区（东京）

Minimax 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
MiniMax M2	0.36 USD	1.45 USD
Minimax M2.1	0.36 USD	1.44 USD

区域：欧洲地区（伦敦）

Minimax 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
MiniMax M2	0.47 USD	1.86 USD
Minimax M2.1	0.47 USD	1.86 USD

区域：欧洲地区（法兰克福）、欧洲地区（斯德哥尔摩）、亚太地区（雅加达）

Minimax 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Minimax M2.1	0.36 USD	1.44 USD

区域：亚太地区（悉尼）

Minimax 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
MiniMax M2	0.3090 USD	1.2360 USD
Minimax M2.1	0.3090 USD	1.2360 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐的定价比标准套餐的定价享受 50% 的折扣

Mistral AI

Mistral AI

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

Mistral 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Devstral 2 135B	0.40 USD	2.00 USD
Magistral Small 1.2	0.50 USD	1.50 USD
Voxtral Mini 1.0	0.04 USD	0.04 USD
Voxtral Small 1.0	0.10 USD	0.30 USD
Ministral 3B 3.0	0.10 USD	0.10 USD
Ministral 8B 3.0	0.15 USD	0.15 USD
Ministral 14B 3.0	0.20 USD	0.20 USD
Mistral Large 3	0.50 USD	1.50 USD

区域：亚太地区（孟买）

Mistral 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Devstral 2 135B	0.48 USD	2.40 USD
Magistral Small 1.2	0.59 USD	1.76 USD
Voxtral Mini 1.0	0.05 USD	0.05 USD
Voxtral Small 1.0	0.12 USD	0.35 USD
Ministral 3B 3.0	0.12 USD	0.12 USD
Ministral 8B 3.0	0.18 USD	0.18 USD
Ministral 14B 3.0	0.24 USD	0.24 USD
Mistral Large 3	0.59 USD	1.76 USD

区域：南美洲（圣保罗）和亚太地区（东京）

Mistral 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Devstral 2 135B	0.48 USD	2.40 USD
Magistral Small 1.2	0.61 USD	1.82 USD
Voxtral Mini 1.0	0.05 USD	0.05 USD
Voxtral Small 1.0	0.12 USD	0.36 USD
Ministral 3B 3.0	0.12 USD	0.12 USD
Ministral 8B 3.0	0.18 USD	0.18 USD
Ministral 14B 3.0	0.24 USD	0.24 USD
Mistral Large 3	0.61 USD	1.82 USD

区域：欧洲地区（爱尔兰）和欧洲地区（米兰）

Mistral 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Devstral 2 135B	0.48 USD	2.40 USD
Magistral Small 1.2	0.59 USD	1.76 USD
Voxtral Mini 1.0	0.05 USD	0.05 USD
Voxtral Small 1.0	0.12 USD	0.35 USD
Ministral 3B 3.0	0.12 USD	0.12 USD
Ministral 8B 3.0	0.18 USD	0.18 USD
Ministral 14B 3.0	0.24 USD	0.24 USD

区域：欧洲地区（伦敦）

Mistral 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Devstral 2 135B	0.62 USD	3.10 USD
Magistral Small 1.2	0.78 USD	2.33 USD
Voxtral Mini 1.0	0.06 USD	0.06 USD
Voxtral Small 1.0	0.16 USD	0.47 USD
Ministral 3B 3.0	0.16 USD	0.16 USD
Ministral 8B 3.0	0.23 USD	0.23 USD
Ministral 14B 3.0	0.31 USD	0.31 USD

区域：亚太地区（悉尼）

Mistral 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Devstral 2 135B	0.41 USD	2.06 USD
Magistral Small 1.2	0.5150 USD	1.5450 USD
Voxtral Mini 1.0	0.0412 USD	0.0412 USD
Voxtral Small 1.0	0.1030 USD	0.3090 USD
Ministral 3B 3.0	0.1030 USD	0.1030 USD
Ministral 8B 3.0	0.1545 USD	0.1545 USD
Ministral 14B 3.0	0.2060 USD	0.2060 USD
Mistral Large 3	0.5150 USD	1.5450 USD

区域：亚太地区（雅加达）、欧洲地区（法兰克福）、欧洲地区（斯德哥尔摩）

Mistral 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Devstral 2 135B	0.48 USD	2.40 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐的定价比标准套餐的定价优惠 50%

Moonshot AI

Moonshot AI

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

Kimi 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Kimi K2 Thinking	0.60 USD	2.50 USD
Kimi K2.5	0.60 USD	3.00 USD

区域：亚太地区（孟买）

Kimi 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Kimi K2 Thinking	0.71 USD	2.94 USD
Kimi K2.5	0.72 USD	3.60 USD

区域：南美洲（圣保罗）和亚太地区（东京）

Kimi 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Kimi K2 Thinking	0.73 USD	3.03 USD
Kimi K2.5	0.72 USD	3.60 USD

区域：欧洲地区（斯德哥尔摩）、亚太地区（雅加达）

Kimi 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Kimi K2.5	0.72 USD	3.60 USD

区域：亚太地区（悉尼）

Kimi 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Kimi K2 Thinking	0.6180 USD	2.5750 USD
Kimi K2.5	0.6180 USD	3.0900 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐的定价比标准套餐的定价享受 50% 的折扣

NVIDIA

NVIDIA

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

NVIDIA 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
NVIDIA Nemotron Nano 2	0.06 USD	0.23 USD
NVIDIA Nemotron Nano 2 VL	0.20 USD	0.60 USD
NVIDIA Nemotron 3 Nano 30B A3B	0.06 USD	0.24 USD

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

NVIDIA 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
NVIDIA Nemotron 3 Super 120B A12B	0.15 USD	0.65 USD

区域：亚太地区（孟买）、欧洲地区（爱尔兰）和欧洲地区（米兰）

NVIDIA 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
NVIDIA Nemotron Nano 2	0.07 USD	0.27 USD
NVIDIA Nemotron Nano 2 VL	0.24 USD	0.71 USD
NVIDIA Nemotron 3 Nano 30B A3B	0.07 USD	0.28 USD

区域：南美洲（圣保罗）和亚太地区（东京）

NVIDIA 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
NVIDIA Nemotron Nano 2	0.07 USD	0.28 USD
NVIDIA Nemotron Nano 2 VL	0.24 USD	0.73 USD
NVIDIA Nemotron 3 Nano 30B A3B	0.07 USD	0.29 USD

区域：欧洲地区（伦敦）

NVIDIA 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
NVIDIA Nemotron Nano 2	0.09 USD	0.36 USD
NVIDIA Nemotron Nano 2 VL	0.31 USD	0.93 USD
NVIDIA Nemotron 3 Nano 30B A3B	0.09 USD	0.37 USD

区域：亚太地区（悉尼）

NVIDIA 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
NVIDIA Nemotron Nano 2	0.0618 USD	0.2369 USD
NVIDIA Nemotron Nano 2 VL	0.2060 USD	0.6180 USD
NVIDIA Nemotron 3 Nano 30B A3B	0.0618 USD	0.2472 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐和批量定价比标准套餐定价优惠 50%

OpenAI

OpenAI

gpt-oss-20b，120b
gpt-oss-safeguard 20b，120b

gpt-oss-20b，120b

标准
优先级
弹性
批量
模型自定义

标准

区域：亚太地区（悉尼）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
gpt-oss-20b	0.0721 USD	0.3090 USD
gpt-oss-120b	0.1545 USD	0.6180 USD

优先级

区域：亚太地区（悉尼）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
gpt-oss-20b	0.1262 USD	0.5408 USD
gpt-oss-120b	0.2704 USD	1.0815 USD

弹性

区域：亚太地区（悉尼）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
gpt-oss-20b	0.0361 USD	0.1545 USD
gpt-oss-120b	0.0773 USD	0.3090 USD

批量

区域：亚太地区（悉尼）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
gpt-oss-20b	0.0361 USD	0.1545 USD
gpt-oss-120b	0.0773 USD	0.3090 USD

模型自定义

模型自定义

强化微调定价

借助 Amazon Bedrock 中的强化微调功能，您无需拥有深厚的机器学习专业知识或大量的标签数据，即可提高模型准确性。Amazon Bedrock 自动执行强化微调工作流：它获取您的示例提示、生成模型回复，并使用您的奖励函数对这些模型回复进行评分。随后，利用这些提示、回复和评分，通过一个迭代式 RFT 工作流来训练您的模型。

整个训练工作流按小时费率计费。训练完成后，客户可以立即使用生成的微调模型进行按需推理。按需推理选项包括基于 token 的定价模式，根据推理过程中处理的 token 数量收费。

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

OpenAI 模型	每个训练时数的价格	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格	每个已训练模型每月的存储价格
gpt-oss-20b	80.00 USD	0.09 USD	0.39 USD	1.95 USD

gpt-oss-safeguard 20b，120b

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GPT OSS Safeguard 20B	0.07 USD	0.20 USD
GPT OSS Safeguard 120B	0.15 USD	0.60 USD

区域：亚太地区（孟买）、南美洲（圣保罗）和亚太地区（东京）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GPT OSS Safeguard 20B	0.08 USD	0.24 USD
GPT OSS Safeguard 120B	0.18 USD	0.71 USD

区域：欧洲地区（爱尔兰）和欧洲地区（米兰）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GPT OSS Safeguard 20B	0.08 USD	0.23 USD
GPT OSS Safeguard 120B	0.18 USD	0.70 USD

区域：欧洲地区（伦敦）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GPT OSS Safeguard 20B	0.11 USD	0.31 USD
GPT OSS Safeguard 120B	0.23 USD	0.93 USD

区域：亚太地区（悉尼）

OpenAI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GPT OSS Safeguard 20B	0.0721 USD	0.2060 USD
GPT OSS Safeguard 120B	0.1545 USD	0.6180 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐和批量定价比标准套餐定价优惠 50%。

Qwen

Amazon Bedrock

Qwen

Qwen3 Coder，32B，235B
Qwen 3 Next，VL，Coder Next

Qwen3 Coder，32B，235B

标准
优先级
弹性
批量
模型自定义

标准

区域：亚太地区（悉尼）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Coder 30B A3B	0.1545 USD	0.6180 USD
Qwen3 32B	0.1545 USD	0.6180 USD
Qwen3 235B A22B 2507	0.2266 USD	0.9064 USD

优先级

区域：亚太地区（悉尼）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Coder 30B A3B	0.2704 USD	1.0815 USD
Qwen3 32B	0.2704 USD	1.0815 USD
Qwen3 235B A22B 2507	0.3966 USD	1.5862 USD

弹性

区域：亚太地区（悉尼）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Coder 30B A3B	0.0773 USD	0.3090 USD
Qwen3 32B	0.0773 USD	0.3090 USD
Qwen3 235B A22B 2507	0.1133 USD	0.4532 USD

批量

区域：亚太地区（悉尼）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Coder 30B A3B	0.0773 USD	0.3090 USD
Qwen3 32B	0.0773 USD	0.3090 USD
Qwen3 235B A22B 2507	0.1133 USD	0.4532 USD

模型自定义

模型自定义

强化微调定价

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

Qwen 模型	每个训练时数的价格	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格	每个已训练模型每月的存储价格
Qwen3 32B	80.00 USD	0.20 USD	0.78 USD	1.95 USD

Qwen 3 Next，VL，Coder Next

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Next 80B A3B	0.15 USD	1.20 USD
Qwen3 VL 235B A22B	0.53 USD	2.66 USD
Qwen3 Coder Next	0.50 USD	1.20 USD

区域：亚太地区（孟买）、欧洲地区（爱尔兰）和欧洲地区（米兰）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Next 80B A3B	0.18 USD	1.41 USD
Qwen3 VL 235B A22B	0.62 USD	3.13 USD
Qwen3 Coder Next	0.60 USD	1.44 USD

区域：南美洲（圣保罗）和亚太地区（东京）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Next 80B A3B	0.18 USD	1.45 USD
Qwen3 VL 235B A22B	0.64 USD	3.22 USD
Qwen3 Coder Next	0.60 USD	1.44 USD

区域：欧洲地区（伦敦）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Next 80B A3B	0.23 USD	1.86 USD
Qwen3 VL 235B A22B	0.82 USD	4.12 USD
Qwen3 Coder Next	0.78 USD	1.86 USD

区域：欧洲地区（法兰克福）和亚太地区（雅加达）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Coder Next	0.60 USD	1.44 USD

区域：亚太地区（悉尼）

Qwen 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Qwen3 Next 80B A3B	0.1545 USD	1.2360 USD
Qwen3 VL 235B A22B	0.5459 USD	2.7398 USD
Qwen3 Coder Next	0.5150 USD	1.2360 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐和批量定价比标准套餐定价优惠 50%。

Stability AI

Stability AI

按需定价

Stability AI 提供的上一代图像模型按图像定价，具体取决于步数和图像分辨率。

区域：俄勒冈州、弗吉尼亚州北部、俄亥俄州

Stability AI 图像服务	每种模型每代的价格
稳定图像移除背景	0.07 USD
稳定图像擦除对象	0.07 USD
稳定图像控制结构	0.07 USD
稳定图像控制草图	0.07 USD
稳定图像风格指南	0.07 USD
稳定图像搜索和替换	0.07 USD
稳定图像修补	0.07 USD
稳定图像搜索和重新着色	0.07 USD
稳定图像风格传输	0.08 USD
稳定图像保守放大	0.40 USD
稳定图像创意放大	0.60 USD
稳定图像快速放大	0.03 USD
稳定图像外绘	0.06 USD

TwelveLabs
TwelveLabs

按需定价
全球跨区域推理

地理和区域内跨区域推理

全球跨区域推理

地理和区域内跨区域推理
Writer

Writer

按需定价

Writer 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Palmyra X4	2.50 USD	10.00 USD
Palmyra X5	0.60 USD	6.00 USD

Z AI

Amazon Bedrock

Z AI

GLM 5
GLM 4.7
GLM 4.7 Flash

GLM 5

按需定价

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 5	1.00 USD	3.20 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐和批量定价比标准套餐定价优惠 50%。

GLM 4.7

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 4.7	0.60 USD	2.20 USD

区域：亚太地区（雅加达）、亚太地区（孟买）、亚太地区（东京）、南美洲（圣保罗）和欧洲地区（斯德哥尔摩）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 4.7	0.72 USD	2.64 USD

区域：亚太地区（悉尼）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 4.7	0.6180 USD	2.2660 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐和批量定价比标准套餐定价优惠 50%。

GLM 4.7 Flash

按需定价

区域：美国东部（弗吉尼亚州北部）、美国东部（俄亥俄州）和美国西部（俄勒冈州）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 4.7 Flash	0.07 USD	0.40 USD

区域：亚太地区（雅加达）、亚太地区（孟买）、亚太地区（东京）、欧洲地区（法兰克福）、欧洲地区（爱尔兰）、欧洲地区（米兰）、欧洲地区（斯德哥尔摩）和南美洲（圣保罗）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 4.7 Flash	0.08 USD	0.48 USD

区域：欧洲地区（伦敦）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 4.7 Flash	0.11 USD	0.62 USD

区域：亚太地区（悉尼）

Z AI 模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
GLM 4.7 Flash	0.0721 USD	0.4120 USD

* 优先级套餐的定价比标准套餐的定价高 75%
* 弹性套餐和批量定价比标准套餐定价优惠 50%。

自定义模型导入

自定义模型导入

Llama

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.05718 USD
每个自定义模型单元的每月存储成本	1.95 USD

区域：欧洲地区（法兰克福）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.07144 USD
每个自定义模型单元的每月存储成本	1.95 USD

注意：托管模型所需的自定义模型单元取决于多种因素，特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考，Llama 3.1 8B 128K 模型需要 2 个自定义模型单元，Llama 3.1 70B 128k 模型需要 8 个自定义模型单元。

*按 5 分钟计费

Multimodal Llama

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.05718 USD
每个自定义模型单元的每月存储成本	1.95 USD

区域：欧洲地区（法兰克福）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.07144 USD
每个自定义模型单元的每月存储成本	1.95 USD

*按 5 分钟计费

Mistral

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.05718 USD
每个自定义模型单元的每月存储成本	1.95 USD

区域：欧洲地区（法兰克福）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.07144 USD
每个自定义模型单元的每月存储成本	1.95 USD

*按 5 分钟计费

Mixtral

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.05718 USD
每个自定义模型单元的每月存储成本	1.95 USD

区域：欧洲地区（法兰克福）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.07144 USD
每个自定义模型单元的每月存储成本	1.95 USD

*按 5 分钟计费

Flan

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.05718 USD
每个自定义模型单元的每月存储成本	1.95 USD

区域：欧洲地区（法兰克福）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.07144 USD
每个自定义模型单元的每月存储成本	1.95 USD

*按 5 分钟计费

按需推理定价：
从第一次成功调用开始，在模型副本处于活动状态期间，将按 5 分钟的时间窗口向您收费。每个模型副本的最大吞吐量和并发限制取决于输入/输出令牌组合、硬件类型、模型大小、架构、推理优化等因素，并在模型导入工作流程中确定。

Bedrock 会根据您的使用模式自动扩展模型副本的数量。如果 5 分钟内没有调用，Bedrock 将缩减到零，并在您调用模型时向上扩展。在向上扩展时，可能会出现一段冷启动持续时间（以十秒为单位），具体取决于模型大小。如果您的推理量持续超过单个模型副本的并发限制，Bedrock 还会增加模型副本的数量。注意：每个帐户每个导入模型的默认最大模型副本数为 3 个，可以通过服务配额增加。

Qwen

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.05718 USD
每个自定义模型单元的每月存储成本	1.95 USD

区域：欧洲地区（法兰克福）

自定义模型单元版本	v1.0
每个自定义模型单元的每分钟价格*	0.07144 USD
每个自定义模型单元的每月存储成本	1.95 USD

*按 5 分钟计费

OpenAI

区域：美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）

自定义模型单元版本	v2.0
每个自定义模型单元的每分钟价格*	0.1433 美元
每个自定义模型单元的每月存储成本	1.95 USD

*按 5 分钟计费

Bedrock 会根据您的使用模式自动扩展模型副本的数量。如果 5 分钟内没有调用，Bedrock 将缩减到零，并在您调用模型时向上扩展。在向上扩展时，可能会出现一段冷启动持续时间（以十秒为单位），具体取决于模型大小。如果您的推理量持续超过单个模型副本的并发限制，Bedrock 还会增加模型副本的数量。注意：每个账户每个导入模型的默认最大模型副本数为 3 个，可以通过服务配额来增加。

知识库
结构化数据检索（SQL 生成）

结构化数据检索按生成 SQL 查询的每个请求收费。生成的 SQL 查询用于从结构化数据存储中检索数据。

重新排列模型

重新排列模型旨在提高检索增强生成（RAG）应用程序中响应的相关性和准确性。按查询收费。

**一个查询中最多可以包含 100 个文档块的大量查询需要付费。如果查询包含超过 100 个文档块，则将其计为多个查询。例如，如果请求包含 350 个文档，则会被视为 4 个查询。请注意，每个文档最多只能包含 512 个令牌（包括查询和文档的总令牌数），如果令牌长度大于 512 个令牌，则将其分解为多个文档。查询等同于搜索单元。
防护机制

Amazon Bedrock 护栏

Amazon Bedrock 护栏的定价基于护栏中使用的筛选条件产生的费用。标准套餐和经典套餐的定价相同。

护栏筛选条件*	价格
标准套餐和经典套餐的内容筛选条件（文本内容）	每 1000 个文本单元 0.15 美元
内容过滤器（图像内容）	处理的每张图像 0.00075 美元
标准套餐和经典套餐的被拒绝主题	每 1000 个文本单元 0.15 美元
敏感信息过滤器	每 1000 个文本单元 0.10 USD
敏感信息过滤器（正则表达式）	免费
文字过滤器	免费
上下文基础检查	每 1000 个文本单元 0.10 USD
自动推理检查功能	根据自动推理策略每 1000 个文本单元 0.17 USD

按需定价

* 每个护栏筛选条件都是可选的，可以根据您的应用程序要求启用。费用将根据护栏中使用的筛选条件类型而定。例如，如果护栏配置了内容筛选条件和被拒绝主题，则会产生与这两个筛选条件相关的费用，而不会产生与敏感信息筛选条件相关的费用。

注意：文本单元最多可包含 1000 个字符。如果文本输入超过 1000 个字符，则将其作为多个文本单元进行处理，每个文本单元包含不超过 1000 个字符。例如，如果文本输入包含 5600 个字符，则将按照 6 个文本单元收费。

上下文基础检查使用参考源和查询来确定模型响应是否基于源并与查询相关。收费文本单元总数是通过合并源、查询和模型响应中的所有字符来计算的。

模型评测

模型评测

模型评测根据通过所选模型进行的推断收费。自动生成的算法分数不收取额外费用。对于自带工作流团队的人工评测，您需要为评测中的模型推理付费，并且每完成一个人工任务需支付 0.21 USD 的费用。

如果您在模型评测中使用 RAG 评测或 LLM-as-a-judge，那么该评判模型所消耗的 token 将按照按需标准套餐价格计费。评判提示会计入您的 token 使用量并产生费用，其内容可在公开文档中查阅。对 Bedrock 知识库进行 RAG 评测时，还会产生 Bedrock 知识库的常规使用费用。

模型

每 1000 个输入令牌的价格

每 1000 个输出令牌的价格

每项人工任务的价格

选定进行评测的模型

基于所选模型

0.21 USD

数据自动化
数据自动化

Amazon Bedrock 数据自动化功能将非结构化的多模态内容转换为适用于智能文档处理、视频分析和 RAG 等使用案例的结构化数据格式。Bedrock 数据自动化功能可以使用模态特定的预定义默认值生成标准输出内容，例如视频的逐场景描述、音频转录或自动文档分析。此外，客户可以根据自己的数据架构在蓝图中指定输出要求来创建自定义输出，然后可以轻松地将这些数据架构加载到现有数据库或数据仓库中。通过与知识库集成，Bedrock 数据自动化功能还可用于解析 RAG 应用程序的内容，通过纳入图像和文本嵌入的信息来提高结果的准确性和相关性。

Amazon Bedrock 知识库提供 Bedrock 数据自动化集成，为多模态数据提供更相关、更准确的回复。设置知识库时，您可以选择 Bedrock Data Automation 作为解析方法，从图像或文档（可能包括数字、图表和图示）中分析和提取有意义的见解。在处理过程中，Bedrock Data Automation 从摄取的文档和图像中提取有意义的信息，然后将其用于后续的知识库步骤中进行分块、嵌入和存储。与知识库集成后，Bedrock Data Automation 可交付标准化输出并收费。
智能提示路由

价格点	定价维度	定价计划
智能提示路由	每 1000 个请求 1 USD	按需

智能提示路由

智能提示路由功能使您能够组合使用来自同一模型家族的基础模型（FM），从而优化质量和成本。例如，借助 Anthropic 的 Claude 模型系列，Amazon Bedrock 可以根据提示的复杂程度，在 Claude 3.5 Sonnet 和 Claude 3 Haiku 之间智能路由请求。同样，Amazon Bedrock 可以在 Meta Llama 3.3 70B 亿参数模型和 3.18B 参数模型，以及 Nova Pro 和 Nova Lite 模型之间路由请求。提示路由器会预测对于每个请求哪个模型能够提供最佳性能，同时有助于优化响应质量和成本。这对于客服助手这类应用尤其有用，简单的查询可以由更小、更快且更具成本效益的模型处理，而复杂的查询则会被路由到更强大的模型。智能提示路由功能可以在不影响准确性的前提下，将成本降低多达 30%。

提示优化

对 Amazon Bedrock 的提示优化

将根据输入提示和优化提示中的令牌数量向您收费。

从 2025 年 4 月 23 日起，所有费用按月结算。

每 1000 个令牌的价格

0.030 USD

定价示例

AI21 labs

应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用：请求 AI21 的 Jurasic-2 Mid 模型将 1 万个令牌的输入文本总结成 2000 个令牌的输出。

产生的总成本 = 1 万个令牌/1000 * 0.0125 美元 + 2000 个令牌/1000 * 0.0125 美元 = 0.15 美元
Amazon

按需定价

应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用：请求 Amazon Titan Text Lite 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。

每小时产生的总成本为 = 2000 个令牌/1000 * 0.0003 美元 + 1000 个令牌/1000 * 0.0004 美元 = 0.001 美元。

应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用：请求 Amazon Titan 图像生成器基础模型生成 1000 张大小为 1024 x 1024 的标准质量图像。

产生的总成本 = 1000 张图像 * 每张图像 0.01 美元 = 10 美元

定制（微调和持续预训练）定价

应用程序开发人员使用 1000 个图像文本对自定义 Amazon Titan 图像生成器模型。训练结束后，开发人员使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后，开发人员使用预配置吞吐量（1 个月承诺期）来托管自定义模型。

微调产生的每月成本为：微调训练（0.005 美元 * 500 * 64），其中 0.005 美元是每张图像的价格，500 是步骤数，64 是批量大小 + 每月自定义模型存储（1.95 美元）+ 一小时的自定义模型推理（21 美元）= 160 美元 + 1.95 美元 + 21 = 182.95 美元

预配置吞吐量定价

应用程序开发人员购买了两个 Amazon Titan Text Express 模型单元，用于处理文本摘要，承诺期为 1 个月。

每月产生的总成本 = 2 个模型单元 * 18.40 美元/小时 * 24 小时 * 31 天 = 27379.20 美元

应用程序开发人员购买了一个基本 Amazon Titan 图像生成器模型的模型单元，承诺期为 1 个月。

产生的总成本 = 1 个模型单元 * 16.20 美元 * 24 小时 * 31 天 = 12052.80 美元
Amazon Bedrock 护栏
示例 1：客户支持聊天机器人
应用程序开发人员创建客户支持聊天机器人，使用内容过滤器屏蔽有害内容，使用被拒绝的话题来过滤不必要的查询和响应。

聊天机器人每小时处理 1000 个用户查询。每个用户查询的平均输入长度为 200 个字符，收到 1500 个字符的 FM 响应。

每个 200 个字符的用户查询对应 1 个文本单元。

每个 1500 个字符的 FM 响应对应 2 个文本单元。

每小时处理的文本单位 = (1 + 2) * 1000 个查询 = 3000 个文本单元

内容过滤器和被拒绝的主题每小时产生的总费用 = 3000 *（0.15 美元 + 0.15 美元）/1000 = 0.90 美元

示例 2：呼叫中心听录文本摘要
应用程序开发人员创建了一个应用程序来总结用户和支持座席之间的聊天记录。它使用敏感信息过滤器来编辑 10000 个对话生成的摘要中的个人身份信息（PII）。

生成的每个摘要平均包含 3500 个字符，对应 4 个文本单元。

总结 1 万个对话所产生的总成本 = 10000 * 4 *（0.1/1000 美元）= 4 美元
示例 3：医疗方案验证引擎
一家医疗保健技术公司在其临床决策支持系统中实施自动推理检查功能，进而根据医疗指南验证治疗建议。

该系统每月处理 5000 例患者病例。每个病例都涉及：
- 患者数据摘要：500 个字符（1 个文本单元）
- 诊断评测：2000 个字符（2 个文本单元）
- 治疗建议：4500 个字符（5 个文本单元）
每月处理的文本单元 =（1 + 2 + 5）5000 个病例 = 4 万个文本单元
自动推理检查功能每月产生的总费用 = 40,000（0.17 美元）/1000 = 6.80 美元
Amazon Bedrock 知识库

定价示例 1（使用 Amazon Rerank 1.0 模型重新排名）

在给定的月份中，您使用 Amazon Rerank 1.0 模型向 Rerank API 发出 200 万个请求，100 万个请求包含少于 100 个文档，因此将按每个请求收费。另外 100 万个请求包含 120-150 个文档，因此每个请求将按 2 个请求收费。

一个请求的价格 = 0.001 美元
总费用 = 1000000 * 0.001 美元 + 1000000 * 2 * 0.001 美元 = 3000 美元

定价示例 2：（结构化数据检索）

应用程序开发人员创建了一个支持聊天机器人，用于查询存储在 Amazon Redshift 中的结构化数据。开发人员创建了一个 Bedrock 知识库并连接到 Amazon Redshift。聊天机器人每小时处理 10000 个用户查询。每个 GenerateQuery API 的费用为 0.002 美元，用于从用户查询生成 SQL。

每小时生成 SQL 产生的总费用 = 0.002 美元 * 10000 = 20 美元。
本月产生的总费用 = 20 美元 * 24 * 30 = 1440 美元
Anthropic

按需定价

应用程序开发人员在美国西部（俄勒冈州）对 Amazon Bedrock 执行了以下 API 调用：请求 Anthropic 的 Claude 模型将 1.1 万个令牌的输入文本总结成 4000 个令牌的输出。

产生的总成本 = 1.1 万个令牌/1000 * 0.008 美元 + 4000 个令牌/1000 * 0.024 美元 = 0.088 美元 + 0.096 美元 = 0.184 美元

预配置吞吐量定价

一位应用程序开发人员在美国西部（俄勒冈州）区域购买了 Anthropic Claude Instant 的一个模型单元：

每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元
Cohere

按需定价

应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用：请求 Cohere 的 Command 模型将 6000 个令牌的输入文本总结成 2000 个令牌的输出。

产生的总成本 = 6000 个令牌/1000 * 0.0015 美元 + 2000 个令牌/1000 * 0.0020 美元 = 0.013 美元

应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用：请求 Cohere 的 Command-Light 模型将 6000 个令牌的输入文本总结成 2000 个令牌的输出。

产生的总成本 = 6000 个令牌/1000 * 0.0003 美元 + 2000 个令牌/1000 * 0.0006 美元 = 0.003 美元

应用程序开发人员对 Amazon Bedrock 进行了以下 API 调用：请求 Cohere 的 Embed 英语或 Embed 多语言模型为 1 万个输入令牌生成嵌入。

产生的总成本为 = 1 万个令牌/1000 * 0.0001 美元 = 0.001 美元

自定义（微调）定价

应用程序开发人员使用 1000 个数据令牌自定义 Cohere 命令模型。训练结束后，使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后，开发人员使用预配置吞吐量（1 个月承诺期）来托管自定义模型。

微调产生的每月成本 = 微调训练（0.004 美元 * 1000 美元）+ 每月自定义模型存储（1.95 美元）+ 1 小时自定义模型推理（49.50 美元）= 55.45 美元

自定义模型的预置吞吐量（1 个月承诺期）产生的每月成本 = 39.60 美元

预配置吞吐量定价

应用程序开发人员购买了一个 Cohere Command 模型单元，用于处理文本摘要，承诺期为 1 个月。

每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元
自定义模型导入

定价示例：应用开发人员在 us-east-1 区域导入了一个自定义的 Llama 3.1 类型模型，该模型大小为 8B 参数，序列长度为 128K，并在 1 个月后删除了该模型。这需要 2 个自定义模型单元。因此，每分钟的价格将为 0.1570 USD，因为需要 2 个自定义模型单元。当月 2 个自定义模型单元的模型存储成本为 3.90 USD。

导入模型不收取任何费用。第一次成功调用是在上午 8:03，此时开始计量。5 分钟的计量窗口为上午 8:03 至上午 8:07；上午 8:07 至上午 8:11，依此类推。如果在任何 5 分钟时间段内有至少一次调用，则该窗口将被视为活跃的计费窗口。如果在上午 8 点 03 分有一次调用，并且在上午 8 点 07 分之后没有其他调用，则计量将在上午 8 点 07 分停止。在这种情况下，账单的计算方式如下：0.1570 美元 * 5 分钟 * 1 个五分钟窗口 = 0.785 美元。
数据自动化

定价示例 1：
假设您使用 BDA 自定义输出处理 1000 页的文档。所有 1000 个页面均使用具有 15 个字段的蓝图 1 进行处理。任何字段数不超过 30 个的蓝图的每页价格均为 0.040 美元。总费用将为 40 美元。

处理的总页数 = 1000
字段数少于 30 个的蓝图的每页价格 = 0.040 美元
总费用 = 1000 * 0.040 美元 = 40 美元

定价示例 2：
假设您使用 BDA 自定义输出处理 2 个文档。文档 1 有 40 页，使用包含 20 个字段的蓝图 1 进行处理。文档 2 有 10 页，使用包含 40 个字段的蓝图 2 进行处理。蓝图 1 的每页价格为 0.040 美元，因为它包含 30 个或更少的字段。蓝图 2 的每页价格为 0.045 美元。使用蓝图 1 处理文档 1 的费用为 1.60 美元。使用蓝图 2 处理文档 2 的费用为 0.45 美元。处理这两个文档的总费用为 2.05 美元。

处理的总页数 = 50
字段数少于 30 个的蓝图 1 的每页价格 = 0.040 美元
包含 40 个字段的蓝图 2 的每页价格 = 0.040 美元 +（超出 30 个之外的额外字段数 * 每个字段 0.0005 美元）
超出 30 个之外的额外字段数 = 40 - 30 = 10
包含 40 个字段的蓝图 2 的每页价格 = 0.040 美元 +（10 * 每个字段 0.0005 美元）= 0.045 美元
使用蓝图 1 的文档 1 费用 = 40 页 x 每页 0.040 美元 = 1.6 美元
使用蓝图 2 的文档 2 费用 = 10 页 x 每页 0.045 美元 = 0.45 美元
总费用 = 文档 1 的费用 + 文档 2 的费用 = 1.6 美元 + 0.45 美元 = 2.05 美元

定价示例 3：
假设您将 Bedrock 知识库设置为将 Bedrock Data Automation 用作解析器，然后提取了一份长达 1000 页的文档。请注意，知识库解析选项之间的成本结构有所不同。BDA 使用每页定价，而基础模型解析器则根据输入和输出令牌收费。就上下文而言，处理 1000 页的内容（其中 30% 的页面包含表格，30% 的页面包含图表）通常需要 2900 个输入令牌和 750 个输出令牌。令牌的使用量会因内容类型而异，因此建议客户使用自己的数据进行测试，以获得更准确的估算。Bedrock 知识库与 Bedrock 数据自动化集成使用的是标准输出，每页的价格为 0.010 美元。总费用将为 10 美元。

处理的总页数 = 1000
标准输出的每页价格 = 0.010 美元
总费用 = 1000 * 0.010 美元 = 10 美元

定价示例 4：
假设您使用 BDA 标准输出处理一段 60 分钟的视频。视频标准输出的每分钟价格为 0.050 美元。总费用将为 3.00 USD。

处理的总分钟数 = 60
视频标准输出的每分钟价格 = 0.050 美元
总费用 = 60 * 0.050 美元 = 3.00 美元

定价示例 5：
假设您使用 BDA 自定义输出处理 2000 个图像。前 1000 个图像使用具有 10 个字段的蓝图 1 进行处理。后 1000 个图像使用具有 40 个字段的蓝图 2 进行处理。蓝图 1 的每个图像价格为 0.005 美元，因为它包含 30 个或更少的字段。蓝图 2 的每个图像价格为 0.01 美元。使用蓝图 1 处理前 1000 个图像的费用为 5.00 美元。使用蓝图 2 处理后 1000 个图像的费用为 10.00 美元。处理所有这 2000 个图像的总费用为 15.00 美元

前 1000 个图像的费用 = 1000 个图像 * 每个图像 0.005 美元 = 5.00 美元
后 1000 个图像的费用 = 1000 个图像 * [0.005 美元 +（超出 30 之外的额外字段数 * 每个字段 0.0005 美元）]
= 1000 *{0.005 美元 + [（40-30）* 0.0005 美元]}
= 1000 * [0.005 美元 + (10 * 0.0005 美元)] = 10.00 美元
总费用 = 5.00 美元 + 10.00 美元 = 15.00 美元

定价示例 6：
假设您想要使用 Bedrock Data Automation 标准输出来处理组织中 15000 分钟的会议录音。处理所有 15000 分钟音频的总费用为 90 美元。

处理的总分钟数 = 15000 分钟
总费用 = 15000 分钟 × 0.006 美元 = 90 美元
DeepSeek

按需定价

应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用：请求 DeepSeek-R1 模型将 2000 个令牌的输入文本总结成 1000 个令牌（包括推理令牌）的输出：

每小时产生的总成本为 = 2000 个令牌/1000 * 0.00135 美元 + 1000 个令牌/1000 * 0.0054 美元 = 0.0081 美元
流

示例：新闻摘要
应用程序开发人员创建了一个流程来自动为交易者提供新闻摘要。该流程包括一个接收 S3 位置的输入节点和一个 S3 检索节点，该节点检索 10 个文件，其中包括来自 S3 中 10 家主要新闻机构的文章（2 个节点过渡）。然后，它使用迭代器节点调用带有提示节点的模型来汇总每个文件（+ 10 个文件 x 2 个节点过渡）。然后，它将使用收集器节点收集所有结果，使用 S3 存储节点将结果写入 S3，并在输出节点（+ 3 次节点转换）中完成。它们每周每半小时运行一次此流程。

每次执行流程的节点转换次数为：2 + 1 + 10 * 2 + 3 = 25 次节点转换/流程执行

每月的流程执行次数为：24 小时 * 2 * 5 天 * 4 周 = 960 次流程执行/月。

每月账单总额为：25 * 960 * 0.035 美元/1000 = 0.84 美元

额外费用
账单还将包括工作流程执行中使用的 AWS 服务的额外费用，包括检索和存储节点中的 Amazon S3 使用费，以及提示节点中的 Amazon Bedrock 基础模型使用费。
Meta

按需定价

应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用：请求 Meta 的 Llama 2 Chat（13B）模型将 2000 个令牌的输入文本总结成 500 个令牌的输出。

产生的总成本为 = 2000 个令牌/1000 * 0.00075 美元 + 500 个令牌/1000 * 0.001 美元 = 0.002 美元

自定义（微调）定价

应用程序开发人员使用 1000 个数据令牌自定义 Llama 2 预训练（70B）模型。训练结束后，使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后，开发人员使用预配置吞吐量（1 个月承诺期）来托管自定义模型。

每月微调产生的费用为：微调训练（0.00799 美元 x 1000）+ 每月自定义模型存储空间（1.95 美元）+ 一小时的自定义模型推理（23.50 美元）= 33.44 美元

自定义模型的预配置吞吐量（1 个月承诺期）产生的每月成本 = 21.18 美元

预配置吞吐量定价

应用程序开发人员购买了一个 Meta Llama 2 模型单元，用于处理文本摘要，承诺期为 1 个月。

每月产生的总成本 = 1 个模型单元 * 21.18 美元 * 24 小时 * 31 天 = 15757.92 美元
Mistral AI

按需定价

应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用：请求 Mistral 7B 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。

每小时产生的总成本为 = 2000 个令牌/1000 * 0.00015 美元 + 1000 个令牌/1000 * 0.0002 美元 = 0.0005 美元

应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用：请求 Mixtral 8x7B 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。

每小时产生的总成本为 = 2000 个令牌/1000 * 0.00045 美元 + 1000 个令牌/1000 * 0.0007 美元 = 0.0016 美元

应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用：请求 Mistral Large 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。

每小时产生的总成本为 = 2000 个令牌/1000 * 0.008 美元 + 1000 个令牌/1000 * 0.024 美元 = 0.04 美元

模型评测

模型评测示例 1：

按需定价
一位应用程序开发人员在美国东部（弗吉尼亚州北部）AWS 区域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant 提交了一个数据集，用于基于人体的模型评估。

该数据集包含 50 个提示，开发人员需要 1 个工作人员对每个提示响应集进行评分（可在评估作业创建中配置为“每个提示的工作人员”参数）。

此评估作业中将有 50 个任务（每个工作人员的每组提示响应有 1 个任务）。50 个提示总计 5000 个输入令牌，相关响应总计为 1.5 万个 Anthropic Claude Instant 令牌和 2 万个 Anthropic Claude 2.1 令牌。

此模型评估作业会产生以下费用：

项目	输入令牌的数量	每 1000 个输入令牌的价格	输入成本	输出令牌的数量	每 1000 个输出令牌的价格	输出成本	人工任务数量	每项人工任务的价格	人工任务的成本	合计
Claude Instant Inference	5000	0.0008 USD	0.004 USD	15000	0.0024 USD	0.036 USD				0.04 USD
Claude 2.1 Inference	5000	0.008 USD	0.04 USD	20000	0.024 USD	0.48 USD				0.52 USD
人工任务							50	0.21 USD	10.50 USD	10.50 USD
合计										11.06 美元

模型评估示例 2：

按需定价
一位应用程序开发人员在美国东部（弗吉尼亚州北部）AWS 区域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant 提交了一个数据集，用于基于人体的模型评估。

该数据集包含 50 个提示，开发人员需要 2 个工作人员对每个提示响应集进行评分（可在评估作业创建中配置为“每个提示的工作人员”参数）。此评估作业中将有 100 个任务（每个工作人员的每组提示响应有 1 个任务：2 个工作人员 x 50 个提示响应集 = 100 个人工任务）。

50 个提示总计 5000 个输入令牌，相关响应总计为 1.5 万个 Anthropic Claude Instant 令牌和 2 万个 Anthropic Claude 2.1 令牌。

此模型评估作业会产生以下费用：

项目	输入令牌的数量	每 1000 个输入令牌的价格	输入成本	输出令牌的数量	每 1000 个输出令牌的价格	输出成本	人工任务数量	每项人工任务的价格	人工任务的成本	合计
Claude Instant Inference	5000	0.0008 USD	0.0040 USD	15000	0.0024 USD	0.036 USD				0.04 USD
Claude 2.1 Inference	5000	0.008 USD	0.0400 USD	20000	0.024 USD	0.48 USD				0.52 USD
人工任务							100	0.21 USD	21.00 USD	21.00 USD
合计										21.56 USD

提示优化

示例：新闻摘要
一位应用程序开发人员使用 Claude 3.5 创建提示来为交易者总结新闻。原始提示包含 429 个令牌。优化后的提示词有 511 个令牌，其中包含更具体的指令和示例，以便从基础模型（FM）生成更简洁的答案。他将这个包含 511 个令牌的优化提示作为提示优化器的输入，并为 Claude 3.7 和 Nova Pro 创建了两个新的提示变体，分别包含 582 个令牌和 579 个令牌。

用于提示优化的输入和输出标记总数为：429 + 511 + 511 + 582 + 511 + 579 = 3123

每月账单总额为：3123 / 1000 * 0.03 美元 = 0.09 美元
Stability AI

按需定价

应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用：请求 SDXL 模型生成尺寸为 512 x 512、步长为 70（高质量）的图像。

产生的总成本 = 1 张图像 * 每张图像 0.036 美元 = 0.036 美元

应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用：请求 SDXL 1.0 模型生成尺寸为 1024 x 1024、步长为 70（高质量）的图像。

产生的总成本 = 1 张图像 * 每张图像 0.08 美元 = 0.08 美元

预配置吞吐量定价

应用程序开发人员购买了一个 SDXL 1.0 模型单元，承诺期为 1 个月。

产生的总成本 = 1 * 49.86 美元 * 24 小时 * 31 天 = 37095.84 美元
TwelveLabs

按需定价

一位应用程序开发人员对 Amazon Bedrock 发起了如下 API 调用：向 Pegasus 1.2 模型请求描述一段 10 秒长的视频内容，该请求的输出为 2000 个令牌。

产生的总费用 = 10 秒 * 0.00049 美元 + 2000 个令牌 / 1000 * 0.0075 美元 = 0.0199 美元

一位应用程序开发人员对 Amazon Bedrock 发起了如下 API 调用：向 Marengo Embed [3.0 或 2.7] 模型请求嵌入 10 个视频，总时长为 100 分钟。

产生的总费用 = 100 分钟（即 6000 秒）* 0.00070 美元 = 4.2 美元

一位应用程序开发人员对 Amazon Bedrock 发起了如下 API 调用：向 Marengo Embed 3.0 模型发出请求，要求通过同时提供文本和图像生成嵌入，可以使用该嵌入在嵌入存储库的给定图像中查找显示袋子的片段，而这些嵌入存储库是使用上述示例创建的。

产生的总费用 = 1 个文本请求 * 0.00007 美元 + 1 个图像请求 * 0.0001 美元 = 0.00017 美元

一位应用程序开发人员对 Amazon Bedrock 发起了如下 API 调用：向 Marengo Embed [3.0 或 2.7] 模型发出请求，通过提供文本生成嵌入，可以使用该嵌入从嵌入存储库中查找匹配的片段，而这些嵌入存储库是使用上述示例创建的。

产生的总费用 = 1 个文本请求 * 0.00007 美元 = 0.00007 美元
Writer

一位应用开发者向 Amazon Bedrock 发出了以下 API 调用：请求使用 Writer 的 Palmyra X5 模型，将一段包含 1 万个令牌的输入文本总结为一个包含 2000 个令牌的输出内容。

产生的总成本 = 1 万个令牌/1000 * 0.003 美元 + 2000 个令牌/1000 * 0.015 美元 = 0.06 美元

后续步骤

讲习会

通过引导式讲习会探索常见 Amazon Bedrock 使用案例

查看讲习会

演示

查看 Amazon Bedrock 功能的演示

探索演示库

元模型	每 100 万个输入 token 的价格	每 100 万个输出 token 的价格
Llama 2 Chat (13B)	0.75 USD	1.00 USD
Llama 2 Chat (70B)	1.95 USD	2.56 USD

元模型	训练 100 万个 token 的价格	*每个自定义模型每月的存储价格**	自定义模型使用 1 个模型单元进行推理的每小时价格（无承诺期的预配置吞吐量定价）
Llama 2 Pretrained (13B)	1.49 USD	1.95 USD	23.50 USD
Llama 2 Pretrained (70B)	7.99 USD	1.95 USD	23.50 美元

元模型	1 个月承诺期内，每个模型单元的每小时价格	6 个月承诺期内，每个模型单元的每小时价格
Llama 2 预训练和聊天（13B）	21.18 USD	13.08 USD
Llama 2 预训练（70B）	21.18 USD	13.08 美元

Amazon Bedrock 定价

模型定价

AI21 Labs

Amazon Nova

理解模型的定价

全球跨区域推理

地理跨区域推理和区域内推理

内置工具

创意内容生成模型的定价

语音理解和生成模型的定价

语音转语音基础模型的按需定价

嵌入模型的定价

Amazon Titan

Anthropic

预留套餐定价

Cohere

DeepSeek

Google

按需定价

Meta

MiniMax AI

Mistral AI

Moonshot AI

NVIDIA

OpenAI

Qwen

Stability AI

TwelveLabs

Writer

Z AI

自定义模型导入

Amazon Bedrock 护栏

模型评测

数据自动化

对 Amazon Bedrock 的提示优化

定价示例

AI21 labs

Amazon

按需定价

定制（微调和持续预训练）定价

预配置吞吐量定价

Amazon Bedrock 护栏

Amazon Bedrock 知识库

Anthropic

按需定价

预配置吞吐量定价

Cohere

按需定价

自定义（微调）定价

自定义模型导入

数据自动化

DeepSeek

流

Meta

按需定价

自定义（微调）定价

预配置吞吐量定价

Mistral AI

按需定价

模型评测

模型评测示例 1：

模型评估示例 2：

提示优化

Stability AI

按需定价

预配置吞吐量定价

TwelveLabs

Writer

后续步骤

通过引导式讲习会探索常见 Amazon Bedrock 使用案例

查看 Amazon Bedrock 功能的演示

了解

资源

开发人员

帮助