Amazon Bedrock expande o suporte para Service Quotas

Publicado: 27 de mai de 2026

O Amazon Bedrock é um serviço totalmente gerenciado que fornece acesso seguro e de nível empresarial a modelos básicos de alta performance das principais empresas de IA, e permite criar e escalar aplicações de IA generativa. Os clientes do Amazon Bedrock agora podem visualizar as cotas de inferência para o endpoint bedrock-mantle por meio do AWS Service Quotas. Isso oferece aos clientes uma forma familiar e consistente de acompanhar os limites desse endpoint, da mesma maneira que já fazem com o endpoint bedrock-runtime e outros serviços da AWS, o que garante visibilidade clara sobre os limites aplicáveis às suas workloads.

O endpoint bedrock-mantle oferece suporte à API OpenAI Responses, à API OpenAI Chat Completions e à API Anthropic Messages, o que permite aos clientes executar aplicações existentes baseadas na OpenAI ou Anthropic no Amazon Bedrock com o mínimo de alterações de código. O AWS Service Quotas agora expõe cotas de tokens de entrada por minuto e de tokens de saída por minuto por modelo para modelos compatíveis no endpoint.

Com este lançamento, os clientes obtêm visibilidade sobre os limites que eles têm no endpoint básico e podem planejar proativamente a escala de produção. Para começar a usá-lo, abra o console do AWS Service Quotas, escolha Amazon Bedrock e pesquise por “Bedrock Mantle” para ver suas cotas atuais. Para solicitar um aumento em qualquer uma dessas cotas, siga o processo padrão de aumento de limite do Amazon Bedrock. O suporte ao Service Quotas para o endpoint bedrock-mantle está disponível em todas as regiões da AWS que oferecem o endpoint: Leste dos EUA (Norte da Virgínia, Ohio), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai, Tóquio, Sydney, Jacarta), Europa (Frankfurt, Irlanda, Londres, Milão, Estocolmo) e América do Sul (São Paulo). Para saber mais, consulte Quotas for Amazon Bedrock