Qwen 模型现已在 Amazon Bedrock 中可用

今天，我们将在 Amazon Bedrock 中新增来自阿里巴巴的 Qwen 模型。此次发布后，Amazon Bedrock 将以完全托管、无服务器的方式开放 Qwen3 开放式权重基础模型（FM）的使用权限，从而继续丰富模型选择。本次共推出四款模型，分别是 Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507 和 Qwen3-32B（密集型）。这些模型采用专家组合（MoE）架构和密集型架构，能为不同应用需求提供灵活选择。

Amazon Bedrock 让用户可以通过统一的 API 访问行业领先的基础模型，无需进行基础设施管理。您可以访问来自多个模型提供商的模型，将其集成到自身应用程序，并根据工作负载需求扩展使用量。使用 Amazon Bedrock 时，绝不会将用户数据用于训练底层模型。随着 Qwen3 模型的加入，Amazon Bedrock 能为以下使用案例提供更多选择：

具备扩展上下文理解能力的代码生成与代码库分析
构建代理式工作流，协调多种工具和 API 以实现业务自动化
采用混合思维模式进行自适应推理，平衡人工智能的成本与性能

Amazon Bedrock 中的 Qwen3 模型
这四款 Qwen3 模型现已在 Amazon Bedrock 中可用，每种模型均针对不同的性能和成本要求进行了优化：

Qwen3-Coder-480B-A35B-Instruct：这是一款专家组合（MoE）模型，总参数量为 4800 亿，活跃参数量为 350 亿。该模型针对编码和代理任务进行了优化，在代理编码、浏览器使用、工具调用等基准测试中表现优异。这些功能使其适用于存储库规模的代码分析和多步工作流程自动化。
Qwen3-Coder-30B-A3B-Instruct：这是一款 MoE 模型，总参数量为 300 亿，活跃参数量为 30 亿。该模型专门针对编码任务和指令遵循场景进行了优化，在跨多种编程语言的代码生成、分析和调试方面表现出强大的性能。
Qwen3-235B-A22B-Instruct-2507：这是一款经过指令微调的 MoE 模型，总参数量为 2350 亿，活跃参数量为 220 亿。该模型在编码、数学及通用推理任务中均具备竞争力，实现了能力与效率的平衡。
Qwen3-32B（密集型）：这是一个具有 32B 参数的密集模型。该模型适用于实时或资源受限的环境（例如移动设备和边缘计算部署），在这些环境中，稳定的性能至关重要。

Qwen3 中的架构和功能特征
Qwen3 模型引入了多种架构和功能特征：

MoE 与密集型架构对比：Qwen3-Coder-480B-A35B、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507 等 MoE 模型在处理每个请求时仅激活部分参数，从而实现高性能和高效推理。密集型 Qwen3-32B 则会激活全部参数，可提供更稳定、可预测的性能。

代理功能：Qwen3 模型可在单次模型调用中完成多步骤推理与结构化规划。该模型集成到代理框架后，能生成调用外部工具或 API 的输出结果。这些模型可在长时间会话中保持扩展上下文。此外，它们还支持工具调用功能，以实现与外部环境的标准化通信。

混合思维模式：Qwen3 采用混合方法解决问题，支持思考和非思考模式。思考模式会在输出最终答案前进行分步推理，适用于需要深度思考的复杂问题；非思考模式则能快速生成近乎即时的响应，适用于相对于深入，更注重速度的简单任务。这可以帮助开发人员更高效地平衡性能和成本。

长上下文处理：Qwen3-Coder 模型支持扩展上下文窗口，原生具有多达 25.6 万个令牌，可通过外推方法扩展至 100 万个令牌。这使模型能够在单次任务中处理完整代码库、大型技术文档或长对话历史记录。

每种模型的适用场景
四款 Qwen3 模型适用于不同的使用案例。Qwen3-Coder-480B-A35B-Instruct 专为复杂软件工程场景设计，适用于高级代码生成、代码库级分析等长上下文处理任务，以及与外部工具的集成工作。Qwen3-Coder-30B-A3B-Instruct 在处理代码补全、代码重构、解答编程相关问题等任务时尤为高效。如果需要跨多个领域的通用性能，Qwen3-235B-A22B-Instruct-2507 是均衡之选，它不仅具备强大的通用推理和指令遵循能力，还能借助 MoE 架构实现高效性能。Qwen3-32B（密集型）则适用于注重性能稳定性、低延迟及成本优化的场景。

开始使用 Amazon Bedrock 中的 Qwen 模型
为了开始使用 Qwen 模型，在 Amazon Bedrock 控制台中，我从导航窗格的配置和学习部分选择模型访问。然后，我找到 Qwen 模型并申请访问权限。在导航窗格的聊天/文本操场部分，我可以使用提示快速测试新的 Qwen 模型。

要将 Qwen3 模型集成到应用程序中，我可以使用任何 AWS SDK。AWS SDK 支持访问 Amazon Bedrock 的 InvokeModel 和 Converse API。此外，我还可以将这些模型与所有支持 Amazon Bedrock 的代理框架配合使用，并通过 Amazon Bedrock AgentCore 部署代理。以下是使用 Strands Agents 构建的具有工具访问权限的简易代理的 Python 代码示例：

from strands import Agent
from strands_tools import calculator

agent = Agent(
    model="qwen.qwen3-coder-480b-instruct-v1:0",
    tools=[calculator]
)

agent("Tell me the square root of 42 ^ 9")

with open("function.py", 'r') as f:
    my_function_code = f.read()

agent(f"Help me optimize this Python function for better performance:\n\n{my_function_code}")

现已推出
目前，Qwen 模型已在以下 AWS 区域推出：

Qwen3-Coder-480B-A35B-Instruct：已在美国西部（俄勒冈州）、亚太地区（孟买、东京）、欧洲地区（伦敦、斯德哥尔摩）区域推出；
Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507、Qwen3-32B：已在美国东部（弗吉尼亚州北部）、美国西部（俄勒冈州）、亚太地区（孟买、东京）、欧洲地区（爱尔兰、伦敦、米兰、斯德哥尔摩）、南美洲（圣保罗）区域推出。

后续区域更新可查看完整区域列表。无需进行基础设施设置或容量规划，即可立即开始测试和开发。要了解更多信息，请访问 Amazon Bedrock 产品页面和 Amazon Bedrock 定价页面。

立即前往 Amazon Bedrock 控制台试用 Qwen 模型，并通过 AWS re:Post for Amazon Bedrock 或常规 AWS Support 渠道提供反馈。

— Danilo

AWS 架构师中心：云端创新的引领者

探索 AWS 架构师中心，获取经实战验证的最佳实践与架构指南，助您高效构建安全、可靠的云上应用

亚马逊AWS官方博客

Qwen 模型现已在 Amazon Bedrock 中可用

AWS 架构师中心： 云端创新的引领者

了解

资源

开发人员

帮助

AWS 架构师中心：云端创新的引领者