Amazon Bedrock ora supporta l'inferenza globale interregionale per Anthropic Claude Sonnet 4
Anthropic Claude Sonnet 4 è ora disponibile in Amazon Bedrock con inferenza globale multi-regione. Con il profilo di inferenza Global Claude Sonnet 4 puoi indirizzare le richieste verso qualsiasi Regione AWS commerciale supportata, ottimizzando le risorse disponibili e aumentando la capacità di throughput del modello.
Amazon Bedrock è un servizio completo, sicuro e flessibile per lo sviluppo di applicazioni e agenti di IA generativa. Quando utilizzi l'inferenza on-demand e batch in Amazon Bedrock, le tue richieste possono essere limitate dalle quote del servizio o durante i periodi di picco. L'inferenza interregionale ti consente di gestire senza interruzioni i picchi di traffico imprevisti, sfruttando le risorse di calcolo disponibili in diverse regioni AWS. Con l'inferenza interregionale puoi distribuire il traffico tra più regioni AWS, ottenendo così un throughput più elevato. In precedenza, era possibile scegliere solo profili di inferenza interregionale legati a una specifica area geografica, come gli Stati Uniti, l'UE o l'APAC. Questi profili instradavano automaticamente le richieste di inferenza verso la regione AWS commerciale ottimale all'interno di quell'area geografica per l'elaborazione. Per i casi d'uso dell'IA generativa che non richiedono la selezione di profili di inferenza legati a un'area geografica specifica, ora puoi utilizzare il profilo di inferenza globale interregionale per aumentare ulteriormente il throughput del modello.
Per saperne di più sull'inferenza globale interregionale in Amazon Bedrock, puoi consultare la documentazione su come aumentare il throughput con l'inferenza interregionale, verificare le regioni e i modelli supportati per i profili di inferenza e seguire i passaggi descritti nella pagina Usare un profilo di inferenza durante la chiamata al modello per iniziare.