Представляем предварительную версию модели Amazon Nova 2 Omni
Мы рады представить Amazon Nova 2 Omni, универсальную модель для мультимодальных рассуждений и генерации изображений. Это первая в отрасли модель рассуждений, которая поддерживает ввод текста, изображений, видео и речи как с текстовым, так и с графическим выводом. Она обеспечивает мультимодальный анализ, генерацию и редактирование изображений на основе естественного языка и расшифровки речи.
В отличие от традиционных подходов, при которых организациям часто приходится объединять несколько специализированных моделей для поддержки различных типов ввода и вывода, благодаря Nova 2 Omni трудоемкое управление несколькими моделями искусственного интеллекта больше не требуется. Это помогает ускорить разработку приложений, одновременно снизив сложность и затраты, и позволяет разработчикам решать самые разные задачи от создания маркетинговых материалов и расшифровки звонков в службу поддержки до анализа видео и документов с графической информацией.
Модель поддерживает контекстное окно размером в 1 млн токенов, более 200 языков для обработки текста и 10 языков речевого ввода. Она способна создавать и редактировать высококачественные изображения при помощи естественного языка, обеспечивать согласованность символов, выводить на изображении текст, а также модифицировать предметы и фон. Nova 2 Omni превосходно понимает речь, используя встроенные функции рассуждения для расшифровки, перевода и резюмирования разговоров с участием множества говорящих. А благодаря гибкому управлению глубиной рассуждений и бюджетом разработчики могут обеспечить оптимальную производительность, точность и контроль над затратами в различных примерах использования.
Модель Nova 2 Omni доступна в предварительной версии с возможностью раннего доступа для всех пользователей Nova Forge. Чтобы запросить к ней доступ, обратитесь к специалистам по работе с клиентами AWS. Подробнее о модели Amazon Nova 2 Omni читайте в руководстве пользователя.