Apresentação do Amazon Nova 2 Omni em pré-visualização
Temos o prazer de anunciar o Amazon Nova 2 Omni, um modelo completo para raciocínio multimodal e geração de imagens. É o primeiro modelo de raciocínio do setor que aceita entradas de texto, imagens, vídeo e fala enquanto gera texto e imagens. Ele oferece compreensão multimodal, geração e edição de imagens usando linguagem natural e transcrição de fala.
Ao contrário das abordagens tradicionais que costumam forçar as organizações a combinar vários modelos especializados, cada um aceitando tipos diferentes de entrada e saída, o Nova 2 Omni elimina a complexidade de gerenciar vários modelos de IA. Dessa forma, ajuda a acelerar o desenvolvimento de aplicações e reduzir a complexidade e os custos, capacitando os desenvolvedores a realizar diversas tarefas, desde a criação de conteúdo de marketing e a transcrição de chamadas de suporte ao cliente até a análise de vídeo e a documentação com recursos visuais.
O modelo oferece uma janela de contexto de 1 milhão de tokens, mais de 200 idiomas para processamento de texto e 10 idiomas para entrada de fala. Ele pode gerar e editar imagens de alta qualidade usando linguagem natural, habilitando consistência de caracteres, renderização de texto na imagem e modificação de objetos e planos de fundo. O Nova 2 Omni oferece uma compreensão de fala superior com raciocínio nativo para transcrever, traduzir e resumir conversas com vários falantes. Além disso, com controles de raciocínio flexíveis para controlar profundidade e orçamento, os desenvolvedores podem garantir performance, precisão e gerenciamento de custos ideais em diferentes casos de uso.
O Nova 2 Omni está em pré-visualização com acesso antecipado disponível para todos os clientes do Nova Forge. Entre em contato com a sua equipe de conta da AWS para obter acesso. Para saber mais sobre o Amazon Nova 2 Omni, leia o Guia do usuário.