Anúncio da inferência otimizada para latência para o modelo de base do Amazon Nova Pro no Amazon Bedrock
O modelo de base do Amazon Nova Pro agora oferece suporte à inferência otimizada para latência na versão prévia do Amazon Bedrock, permitindo tempos de resposta mais rápidos e melhor capacidade de resposta para aplicações de IA generativa. A inferência otimizada para latência acelera os tempos de resposta para aplicações sensíveis à latência, melhorando a experiência do usuário final e dando aos desenvolvedores mais flexibilidade para otimizar a performance do seu caso de uso. O acesso a esses recursos não requer configuração adicional ou ajuste fino do modelo, o que permite o aprimoramento imediato das aplicações existentes com tempos de resposta mais rápidos.
A inferência otimizada para latência do Amazon Nova Pro está disponível por meio da inferência entre regiões nas regiões Oeste dos EUA (Oregon), Leste dos EUA (Virgínia) e Leste dos EUA (Ohio). Saiba mais sobre os modelos de base do Amazon Nova no blog de notícias da AWS, na página de produto do Amazon Nova ou no guia do usuário do Amazon Nova. Saiba mais sobre a inferência otimizada para latência no Bedrock na documentação. Você pode começar a usar os modelos de base do Amazon Nova no Amazon Bedrock no console do Amazon Bedrock.