プレビュー版の Amazon Nova 2 Omni のご紹介

投稿日: 2025年12月2日

AWS は、新マルチモーダル推論と画像生成のためのオールインワンモデルである Amazon Nova 2 Omni を発表しました。これは、テキスト、画像、動画、音声の入力をサポートしつつ、テキストと画像の両方の出力を生成できる業界初の推論モデルです。これにより、マルチモーダル理解、自然言語を使用した画像生成と編集、音声書き起こしが可能になります。

従来のアプローチでは、異なる入力形式と出力形式をサポートする複数の専門モデルを組み合わせる必要がありましたが、Nova 2 Omni を使用することで複数の AI モデルを管理する複雑さが解消されます。これにより、複雑さとコストを軽減しながらアプリケーション開発を加速することができます。そのため、デベロッパーは、マーケティングコンテンツの作成やカスタマーサポート通話の書き起こしから、動画分析や視覚的支援によるドキュメンテーションまで、さまざまなタスクに取り組めるようになります。

このモデルは、100 万トークンのコンテキストウィンドウ、200 以上の言語によるテキスト処理、10 言語の音声入力をサポートしています。自然言語を使用して高品質の画像を生成および編集できるため、文字の一貫性の確保、画像内でのテキストレンダリング、オブジェクトや背景の変更が可能になります。Nova 2 Omni には、ネイティブな推論機能に基づく高度な音声理解が備わっているため、複数話者の会話の書き起こし、翻訳、要約を行えます。また、推論の深さや予算を柔軟に制御できるため、デベロッパーはさまざまなユースケースで最適なパフォーマンス、精度、コスト管理を実現できます。

Nova 2 Omni はプレビュー段階にあり、すべての Nova Forge のお客様が先行アクセスを利用できます。アクセスをご希望の方は、AWS アカウントチームにお問い合わせください。Amazon Nova 2 Omni の詳細については、ユーザーガイドをお読みください。