宣布推出用于实时对话式人工智能的 Amazon Nova 2 Sonic

发布于: 2025年12月2日

今天，Amazon 宣布推出 Amazon Nova 2 Sonic，这是我们的语音转语音模型，用于自然、实时的对话式人工智能。它提供一流的流媒体语音理解，能够有效应对背景噪音和用户不同的说话风格，高效处理对话，并能生成多种语言母语级表达力的语音（多语种语音）。与之前的模型相比，它具有更好的推理、指令遵循和工具调用准确性。

Nova 2 Sonic 基于初代 Nova Sonic 模型引入的功能构建，并新增了多项功能，包括扩展的语言支持（葡萄牙语和印地语）、多语种语音功能（使模型能够使用同一声音实现多语言母语级表达力）以及轮流对话控制功能（允许开发者设置低、中、高三种停顿灵敏度）。该模型还增加了跨模态交互功能，允许用户在同一个会话中在语音和文本之间无缝切换，在不中断对话流程的情况下调用异步工具以支持多步骤任务，以及一个用于持续交互的一百万个令牌的上下文窗口。

开发者可以使用 Amazon Bedrock 的双向流式传输 API 将 Nova Sonic 2 直接集成到实时语音系统中。Nova Sonic 2 现在还可以与 Amazon Connect 和其他领先的电话服务提供商（包括 Vonage、Twilio 和 AudioCodes）以及 LiveKit 和 Pipecat 等开源框架无缝集成。

Amazon Nova 2 Sonic 已在以下 AWS 区域的 Amazon Bedrock 中推出：美国东部（弗吉尼亚州北部）、美国西部（俄勒冈州）和亚太地区（东京）。要了解更多信息，请阅读 AWS 新闻博客和 Amazon Nova Sonic 用户指南。要开始在 Amazon Bedrock 中使用 Nova Sonic 2，请访问 Amazon Bedrock 控制台。

宣布推出用于实时对话式人工智能的 Amazon Nova 2 Sonic

了解

资源

开发人员

帮助