Amazon Bedrock já oferece suporte à inferência global entre regiões para o Anthropic Claude Sonnet 4

Publicado: 3 de set de 2025

Agora, o Claude Sonnet 4 da Anthropic está disponível com inferência global entre regiões no Amazon Bedrock. Você já pode usar o perfil de inferência global do Claude Sonnet 4 para encaminhar suas solicitações de inferência para processamento em qualquer região comercial da AWS com suporte, otimizar os recursos disponíveis e permitir maior throughput do modelo.

O Amazon Bedrock é um serviço abrangente, seguro e flexível para a criação de aplicações e agentes de IA generativa. Ao usar inferência sob demanda e em lote no Amazon Bedrock, suas solicitações podem ser restringidas por Service Quotas ou durante horários de pico de uso. A inferência entre regiões permite que você gerencie de forma integrada picos de tráfego não planejados, utilizando a computação em diferentes regiões da AWS. Com a inferência entre regiões, você pode distribuir o tráfego entre várias regiões da AWS, habilitando um maior throughput. Anteriormente, você podia escolher perfis de inferência entre regiões vinculados a uma área geográfica específica, como EUA, UE ou APAC, que selecionavam automaticamente a região comercial ideal da AWS dentro dessa área geográfica para processar as solicitações de inferência. Para casos de uso de IA generativa que não exigem que você escolha perfis de inferência vinculados a uma área geográfica específica, você já pode usar o perfil de inferência global entre regiões para aumentar ainda mais o throughput do modelo.

Para saber mais sobre a inferência global entre regiões no Amazon Bedrock, acesse a documentação sobre o aumento de throughput com inferência entre regiões, consulte as regiões e modelos com suporte para perfis de inferência e siga as etapas mencionadas na página Use an inference profile in model invocation para começar a usar.