NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上推出

发布于: 2025年12月23日

Amazon Bedrock 现已支持 NVIDIA Nemotron 3 Nano 30B A3B 模型,该模型是 NVIDIA 在高效语言建模领域取得的最新突破性成果,可提供卓越的推理性能、原生工具调用支持,并能借助 25.6 万个词元的上下文窗口实现扩展上下文处理。该模型采用高效的混合专家(MoE)架构,可在代理式工作负载与编码工作负载中实现比前代模型更高的吞吐量,同时保持大型模型的深度推理能力。该模型通过先进的强化学习技术和大规模多环境后训练,实现了精准的推理控制与更高的准确度,已成为企业、初创企业及个人开发人员完成工作的理想选择,适用于构建多代理工作流与开发人员生产力工具、实现流程自动化以及开展科学与数学推理分析等场景。

Amazon Bedrock 上的 NVIDIA Nemotron 3 Nano 由 Project Mantle 提供支持,Project Mantle 是一个新的分布式推理引擎,用于在 Amazon Bedrock 上提供大规模机器学习模型。Project Mantle 简化并加快了新模型在 Amazon Bedrock 上的上线,通过完善的服务质量控制提供高性能和可靠的无服务器推理,并通过自动容量管理和统一池解锁更高的默认客户配额,同时提供与 OpenAI API 规格的开箱即用兼容性。

NVIDIA Nemotron 3 Nano 现已在美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)、美国西部(俄勒冈州)、亚太地区(东京)、亚太地区(孟买)、南美洲(圣保罗)、欧洲地区(伦敦)和欧洲地区(米兰)AWS 区域推出,并支持 Amazon Bedrock 上的统一端点以及与 OpenAI API 兼容的服务端点。要了解更多信息并开始使用,请访问 Amazon Bedrock 控制台此处的服务文档。要开始使用与 Amazon Bedrock OpenAI API 兼容的服务端点,请访问此处的文档。