宣布推出用于实时对话式人工智能的 Amazon Nova 2 Sonic
发布于:
2025年12月2日
今天,Amazon 宣布推出 Amazon Nova 2 Sonic,这是我们的语音转语音模型,用于自然、实时的对话式人工智能。 它提供一流的流媒体语音理解,能够有效应对背景噪音和用户不同的说话风格,高效处理对话,并能生成多种语言母语级表达力的语音(多语种语音)。与之前的模型相比,它具有更好的推理、指令遵循和工具调用准确性。
Nova 2 Sonic 基于初代 Nova Sonic 模型引入的功能构建,并新增了多项功能,包括扩展的语言支持(葡萄牙语和印地语)、多语种语音功能(使模型能够使用同一声音实现多语言母语级表达力)以及轮流对话控制功能(允许开发者设置低、中、高三种停顿灵敏度)。该模型还增加了跨模态交互功能,允许用户在同一个会话中在语音和文本之间无缝切换,在不中断对话流程的情况下调用异步工具以支持多步骤任务,以及一个用于持续交互的一百万个令牌的上下文窗口。
开发者可以使用 Amazon Bedrock 的双向流式传输 API 将 Nova Sonic 2 直接集成到实时语音系统中。Nova Sonic 2 现在还可以与 Amazon Connect 和其他领先的电话服务提供商(包括 Vonage、Twilio 和 AudioCodes)以及 LiveKit 和 Pipecat 等开源框架无缝集成。
Amazon Nova 2 Sonic 已在以下 AWS 区域的 Amazon Bedrock 中推出:美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)和亚太地区(东京)。要了解更多信息,请阅读 AWS 新闻博客和 Amazon Nova Sonic 用户指南。要开始在 Amazon Bedrock 中使用 Nova Sonic 2,请访问 Amazon Bedrock 控制台。