Amazon Bedrock ora supporta l'inferenza interregionale

Inserito il: 27 ago 2024

Amazon Bedrock annuncia oggi il supporto per l'inferenza interregionale, un'opzione che consente agli sviluppatori di gestire in modo efficiente i picchi di traffico utilizzando le risorse di calcolo disponibili in diverse regioni AWS. Con l'inferenza interregionale, i clienti Bedrock in modalità on-demand potranno usufruire di limiti di throughput più alti (fino a raddoppiare le quote assegnate nella regione) e di una resilienza potenziata durante i periodi di elevata domanda. Attivando questa funzione, gli sviluppatori possono evitare di dedicare tempo e risorse alla previsione delle fluttuazioni della domanda. L'inferenza interregionale, invece, distribuisce automaticamente il traffico tra più regioni, garantendo la massima disponibilità per ogni richiesta e un'esperienza più fluida durante i picchi di utilizzo.

I clienti possono scegliere da un insieme predefinito di regioni dove far transitare i dati di inferenza, supportandoli nel rispetto dei requisiti di residenza e delle leggi sulla sovranità dei dati. Inoltre, questa funzionalità dà priorità alla regione sorgente dell'API Bedrock connessa, quando possibile, aiutando a ridurre la latenza e a migliorare la reattività. In questo modo, i clienti possono ottimizzare la stabilità, le prestazioni e l'efficienza delle proprie applicazioni.

L'uso dell'inferenza interregionale non comporta costi di instradamento aggiuntivi e l'addebito verrà effettuato in base alla regione da cui è stata originata la richiesta (regione sorgente). L'elenco dei modelli supportati e delle regioni predefinite è disponibile qui. Per ulteriori informazioni sulla funzionalità e su come iniziare, consulta la documentazione di Amazon Bedrock o questo blog.