推出 Amazon Nova 2 Omni 预览版

发布于: 2025年12月2日

我们很高兴地宣布推出 Amazon Nova 2 Omni,这是一款用于多模态推理和图像生成的多合一模型。它是业界第一个支持文本、图像、视频和语音输入的推理模型,同时生成文本和图像输出。该模型支持多模态理解、使用自然语言生成和编辑图像以及语音转录。

与通常迫使组织拼接各种专业模型(每种模型支持不同的输入和输出类型)的传统方法不同,Nova 2 Omni 消除了管理多个人工智能模型的复杂性。这有助于加快应用程序开发,同时降低复杂性和成本,使开发人员能够处理各种任务,从营销内容创建和客户支持电话转录到视频分析和使用视觉辅助工具编制文档。

该模型支持 100 万个令牌上下文窗口、200 多种语言的文本处理和 10 种语言的语音输入。它可以使用自然语言生成和编辑高质量的图像,从而实现字符一致性、图像内文本渲染以及对象和背景修改。Nova 2 Omni 在语音理解方面表现出色,可利用原生推理能力转录、翻译和总结多人对话。通过灵活的推理深度和预算控制,开发人员可确保在不同的使用案例中实现最佳性能、准确性和成本管理。

Nova 2 Omni 现已进入预览阶段,所有 Nova Forge 客户均可抢先体验。请联系您的 AWS 账户团队获取访问权限。要了解有关 Amazon Nova 2 Omni 的更多信息,请阅读用户指南。