Introduzione dell'inferenza ottimizzata per la latenza per il modello di fondazione di Amazon Nova Pro su Amazon Bedrock
Ora il modello di fondazione di Amazon Nova Pro supporta in anteprima l'inferenza ottimizzata per la latenza su Amazon Bedrock, garantendo tempi di risposta più rapidi e una maggiore reattività per le applicazioni di IA generativa. Questa innovazione accelera i tempi di risposta per le applicazioni sensibili alla latenza, migliorando l'esperienza utente e offrendo agli sviluppatori maggiore flessibilità nell'ottimizzazione delle prestazioni per il loro caso d'uso. L'accesso a queste funzionalità non richiede alcuna configurazione aggiuntiva o messa a punto del modello, consentendo un miglioramento immediato delle applicazioni esistenti con tempi di risposta più rapidi.
L'inferenza ottimizzata per la latenza per Amazon Nova Pro è disponibile tramite inferenza tra regioni nelle regioni AWS Stati Uniti occidentali (Oregon), Stati Uniti orientali (Virginia) e Stati Uniti orientali (Ohio). Per ulteriori informazioni sui modelli di fondazione di Amazon Nova consulta il blog AWS News, la pagina del prodotto di Amazon Nova o la guida utente di Amazon Nova. Per ulteriori informazioni sull'inferenza ottimizzata per la latenza su Bedrock consulta la relativa documentazione. Puoi iniziare a usare i modelli di fondazione di Amazon Nova in Amazon Bedrock nella console di Amazon Bedrock.