Amazon Bedrock apresenta o nível de serviço reservado

Publicado: 26 de nov de 2025

Hoje, o Amazon Bedrock apresenta um novo nível de serviço reservado, projetado para workloads que exigem performance previsível e capacidade garantida de tokens por minuto. O nível reservado oferece a capacidade de reservar capacidade computacional priorizada, mantendo os níveis de serviço previsíveis para suas aplicações essenciais. Também inclui a flexibilidade de alocar diferentes capacidades de tokens de entrada e saída por minuto para atender aos requisitos exatos de sua workload e controlar os custos. Isso é particularmente valioso porque muitas workloads têm padrões de uso de tokens assimétricos. Por exemplo, as tarefas de resumo consomem muitos tokens de entrada, mas geram menos tokens de saída, enquanto as aplicações de geração de conteúdo exigem menos entrada e mais capacidade de saída. Quando sua aplicação precisa de mais capacidade de tokens por minuto do que a que você reservou, o serviço transborda automaticamente para o nível padrão de pagamento conforme o uso, garantindo operações ininterruptas. O nível reservado visa um tempo de atividade de 99,5% para resposta do modelo e está disponível hoje para o Anthropic Claude Sonnet 4.5. Os clientes podem reservar capacidade por 1 mês ou 3 meses. Os clientes pagam um preço fixo por 1.000 tokens por minuto e a cobrança é feita mensalmente.

Com o nível de serviço reservado, o Amazon Bedrock continua oferecendo mais opções aos clientes, ajudando-os a desenvolver, escalar e implantar aplicações e agentes que melhoram a produtividade e as experiências dos clientes, equilibrando os requisitos de performance e custo.

Para obter mais informações sobre as regiões da AWS nas quais o Amazon Bedrock reservado está disponível, consulte a documentação. Para obter acesso ao nível reservado, entre em contato com sua equipe de contas da AWS.