推出預覽版 Amazon Nova 2 Omni
張貼日期:
2025年12月2日
我們很高興宣佈推出 Amazon Nova 2 Omni,這是一款具備多模態推理與影像生成能力的全方位模型。這是業界第一款支援文字、影像、影片與語音輸入,同時能生成文字與影像輸出的推理模型。它能夠進行多模態理解、使用自然語言進行影像生成與編輯,以及語音轉寫。
不同於傳統方式常需要企業拼接多個專用模型 (各自支援不同的輸入與輸出類型),Nova 2 Omni 消除了管理多個 AI 模型的複雜性。這有助於加速應用程式開發,同時降低複雜度與成本,讓開發人員能處理多樣化任務,從行銷內容製作、客戶支援通話逐字稿,到影片分析與具備視覺輔助的文件撰寫皆能勝任。
該模型支援一百萬個詞元的上下文視窗、能處理 200 多種語言的文字,以及 10 種語言的語音輸入。它能夠透過自然語言生成並編輯高品質影像,支援角色一致性、影像中文字渲染,以及物件與背景的修改。Nova 2 Omni 搭載原生推理,可提供卓越的語音理解能力,以轉錄、翻譯與摘要多人對話。透過靈活的推理控制,可針對推理深度與成本預算進行調整,讓開發人員能在不同使用情境中確保最佳效能、精確度與成本管理。
Nova 2 Omni 目前為預覽版,開放所有 Nova Forge 客戶搶先體驗。請聯絡您的 AWS 帳戶團隊以取得存取權限。如需進一步了解 Amazon Nova 2 Omni,請參閱使用者指南。