Introduzione dell'inferenza ottimizzata per la latenza per il modello di fondazione di Amazon Nova Pro su Amazon Bedrock

Inserito il: 5 mar 2025

Ora il modello di fondazione di Amazon Nova Pro supporta in anteprima l'inferenza ottimizzata per la latenza su Amazon Bedrock, garantendo tempi di risposta più rapidi e una maggiore reattività per le applicazioni di IA generativa. Questa innovazione accelera i tempi di risposta per le applicazioni sensibili alla latenza, migliorando l'esperienza utente e offrendo agli sviluppatori maggiore flessibilità nell'ottimizzazione delle prestazioni per il loro caso d'uso. L'accesso a queste funzionalità non richiede alcuna configurazione aggiuntiva o messa a punto del modello, consentendo un miglioramento immediato delle applicazioni esistenti con tempi di risposta più rapidi.

L'inferenza ottimizzata per la latenza per Amazon Nova Pro è disponibile tramite inferenza tra regioni nelle regioni AWS Stati Uniti occidentali (Oregon), Stati Uniti orientali (Virginia) e Stati Uniti orientali (Ohio). Per ulteriori informazioni sui modelli di fondazione di Amazon Nova consulta il blog AWS News, la pagina del prodotto di Amazon Nova o la guida utente di Amazon Nova. Per ulteriori informazioni sull'inferenza ottimizzata per la latenza su Bedrock consulta la relativa documentazione. Puoi iniziare a usare i modelli di fondazione di Amazon Nova in Amazon Bedrock nella console di Amazon Bedrock.