亚马逊AWS官方博客
Qwen 模型现已在 Amazon Bedrock 中可用
今天,我们将在 Amazon Bedrock 中新增来自阿里巴巴的 Qwen 模型。此次发布后,Amazon Bedrock 将以完全托管、无服务器的方式开放 Qwen3 开放式权重基础模型(FM)的使用权限,从而继续丰富模型选择。本次共推出四款模型,分别是 Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507 和 Qwen3-32B(密集型)。这些模型采用专家组合(MoE)架构和密集型架构,能为不同应用需求提供灵活选择。
Amazon Bedrock 让用户可以通过统一的 API 访问行业领先的基础模型,无需进行基础设施管理。您可以访问来自多个模型提供商的模型,将其集成到自身应用程序,并根据工作负载需求扩展使用量。使用 Amazon Bedrock 时,绝不会将用户数据用于训练底层模型。随着 Qwen3 模型的加入,Amazon Bedrock 能为以下使用案例提供更多选择:
- 具备扩展上下文理解能力的代码生成与代码库分析
- 构建代理式工作流,协调多种工具和 API 以实现业务自动化
- 采用混合思维模式进行自适应推理,平衡人工智能的成本与性能
Amazon Bedrock 中的 Qwen3 模型
这四款 Qwen3 模型现已在 Amazon Bedrock 中可用,每种模型均针对不同的性能和成本要求进行了优化:
- Qwen3-Coder-480B-A35B-Instruct:这是一款专家组合(MoE)模型,总参数量为 4800 亿,活跃参数量为 350 亿。该模型针对编码和代理任务进行了优化,在代理编码、浏览器使用、工具调用等基准测试中表现优异。这些功能使其适用于存储库规模的代码分析和多步工作流程自动化。
- Qwen3-Coder-30B-A3B-Instruct:这是一款 MoE 模型,总参数量为 300 亿,活跃参数量为 30 亿。该模型专门针对编码任务和指令遵循场景进行了优化,在跨多种编程语言的代码生成、分析和调试方面表现出强大的性能。
- Qwen3-235B-A22B-Instruct-2507:这是一款经过指令微调的 MoE 模型,总参数量为 2350 亿,活跃参数量为 220 亿。该模型在编码、数学及通用推理任务中均具备竞争力,实现了能力与效率的平衡。
- Qwen3-32B(密集型):这是一个具有 32B 参数的密集模型。该模型适用于实时或资源受限的环境(例如移动设备和边缘计算部署),在这些环境中,稳定的性能至关重要。
Qwen3 中的架构和功能特征
Qwen3 模型引入了多种架构和功能特征:
MoE 与密集型架构对比:Qwen3-Coder-480B-A35B、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507 等 MoE 模型在处理每个请求时仅激活部分参数,从而实现高性能和高效推理。密集型 Qwen3-32B 则会激活全部参数,可提供更稳定、可预测的性能。
代理功能:Qwen3 模型可在单次模型调用中完成多步骤推理与结构化规划。该模型集成到代理框架后,能生成调用外部工具或 API 的输出结果。这些模型可在长时间会话中保持扩展上下文。此外,它们还支持工具调用功能,以实现与外部环境的标准化通信。
混合思维模式:Qwen3 采用混合方法解决问题,支持思考和非思考模式。思考模式会在输出最终答案前进行分步推理,适用于需要深度思考的复杂问题;非思考模式则能快速生成近乎即时的响应,适用于相对于深入,更注重速度的简单任务。这可以帮助开发人员更高效地平衡性能和成本。
长上下文处理:Qwen3-Coder 模型支持扩展上下文窗口,原生具有多达 25.6 万个令牌,可通过外推方法扩展至 100 万个令牌。这使模型能够在单次任务中处理完整代码库、大型技术文档或长对话历史记录。
每种模型的适用场景
四款 Qwen3 模型适用于不同的使用案例。Qwen3-Coder-480B-A35B-Instruct 专为复杂软件工程场景设计,适用于高级代码生成、代码库级分析等长上下文处理任务,以及与外部工具的集成工作。Qwen3-Coder-30B-A3B-Instruct 在处理代码补全、代码重构、解答编程相关问题等任务时尤为高效。如果需要跨多个领域的通用性能,Qwen3-235B-A22B-Instruct-2507 是均衡之选,它不仅具备强大的通用推理和指令遵循能力,还能借助 MoE 架构实现高效性能。Qwen3-32B(密集型)则适用于注重性能稳定性、低延迟及成本优化的场景。
开始使用 Amazon Bedrock 中的 Qwen 模型
为了开始使用 Qwen 模型,在 Amazon Bedrock 控制台中,我从导航窗格的配置和学习部分选择模型访问。然后,我找到 Qwen 模型并申请访问权限。在导航窗格的聊天/文本操场部分,我可以使用提示快速测试新的 Qwen 模型。
要将 Qwen3 模型集成到应用程序中,我可以使用任何 AWS SDK。AWS SDK 支持访问 Amazon Bedrock 的 InvokeModel 和 Converse API。此外,我还可以将这些模型与所有支持 Amazon Bedrock 的代理框架配合使用,并通过 Amazon Bedrock AgentCore 部署代理。以下是使用 Strands Agents 构建的具有工具访问权限的简易代理的 Python 代码示例:
from strands import Agent from strands_tools import calculator agent = Agent( model="qwen.qwen3-coder-480b-instruct-v1:0", tools=[calculator] ) agent("Tell me the square root of 42 ^ 9") with open("function.py", 'r') as f: my_function_code = f.read() agent(f"Help me optimize this Python function for better performance:\n\n{my_function_code}")
现已推出
目前,Qwen 模型已在以下 AWS 区域推出:
- Qwen3-Coder-480B-A35B-Instruct:已在美国西部(俄勒冈州)、亚太地区(孟买、东京)、欧洲地区(伦敦、斯德哥尔摩)区域推出;
- Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507、Qwen3-32B:已在美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(孟买、东京)、欧洲地区(爱尔兰、伦敦、米兰、斯德哥尔摩)、南美洲(圣保罗)区域推出。
后续区域更新可查看完整区域列表。无需进行基础设施设置或容量规划,即可立即开始测试和开发。要了解更多信息,请访问 Amazon Bedrock 产品页面和 Amazon Bedrock 定价页面。
立即前往 Amazon Bedrock 控制台试用 Qwen 模型,并通过 AWS re:Post for Amazon Bedrock 或常规 AWS Support 渠道提供反馈。
— Danilo
AWS 架构师中心: 云端创新的引领者探索 AWS 架构师中心,获取经实战验证的最佳实践与架构指南,助您高效构建安全、可靠的云上应用 |
![]() |

