NVIDIA Nemotron-3-Super-120B、Qwen3.5-9B 和 Qwen3.5-27B 模型现已在 Amazon SageMaker JumpStart 推出
NVIDIA 的 Nemotron-3-Super-120B 以及 Qwen3.5-9B、Qwen3.5-27B 模型现已在 Amazon SageMaker JumpStart 中提供,为 AWS 客户提供了更丰富的基础模型选择。这三种模型带来了涵盖代理式推理、多语言编程和高级指令遵循在内的专业功能,使客户能够在 AWS 基础设施上部署高性能、可扩展的 AI 解决方案。
这些模型利用专业功能应对不同的企业人工智能挑战:
Nemotron-3-Super-120B 针对协作式代理和高容量工作负载(如 IT 工单自动化)进行了优化。它采用混合式潜在专家混合 (LatentMoE) 架构,结合了 Mamba-2 和 MoE 层,具备强大的代理式推理和对话功能,适用于软件开发和网络安全分级等场景。
Qwen 3.5 9B 在多语言编程、指令遵循和长远规划方面表现出色,可自动执行软件开发工作流程,并处理复杂的多步骤办公任务。其紧凑的设计平衡了效率与性能,适用于资源受限的环境。
Qwen 3.5 27B 提供更深层次的上下文理解、扩展的推理能力以及增强的空间/复杂场景理解能力,是高级多模态推理和大规模文档处理的理想之选。
借助 SageMaker JumpStart,客户只需点击几下即可部署这些模型中的任何一个,以解决其特定的人工智能使用案例。
要开始使用这些模型,请导航到 SageMaker 控制台中的 SageMaker JumpStart 模型目录,或使用 SageMaker Python SDK 将模型部署到您的 AWS 账户。有关在 SageMaker JumpStart 中部署和使用基础模型的更多信息,请参阅 Amazon SageMaker JumpStart 文档。