Amazon SageMaker AI ora supporta la capacità dei piani di addestramento flessibili per l'inferenza

Inserito il: 26 nov 2025

I piani di addestramento flessibili (FTP) di Amazon SageMaker AI ora supportano gli endpoint di inferenza, garantendo ai clienti capacità GPU riservata per valutazioni pianificate e picchi di carico in produzione. Ora i clienti possono riservare i tipi di istanza specifici necessari e affidare a SageMaker AI l'avvio automatico dell'endpoint di inferenza, senza dover gestire direttamente l'infrastruttura.

Durante la pianificazione dei cicli di sviluppo ML, i clienti necessitano della certezza che le GPU richieste per la valutazione del modello e i test di pre-produzione siano disponibili esattamente nelle date previste. FTP semplifica l'accesso dei clienti alla capacità GPU per l'esecuzione di carichi di lavoro di ML. Il supporto FTP per gli endpoint di inferenza consente di scegliere i tipi di istanza preferiti, i requisiti di calcolo, la durata della prenotazione e la data di avvio del carico di lavoro di inferenza. Durante la creazione dell'endpoint, è sufficiente specificare l'ARN della prenotazione e SageMaker AI provvede automaticamente al provisioning ed esegue l'endpoint sulla capacità garantita per l'intera durata del piano. In questo modo si eliminano settimane di attività di gestione dell'infrastruttura e pianificazione, consentendo di eseguire l'inferenza in modo prevedibile e di concentrare il tempo sul miglioramento delle prestazioni del modello.

Il supporto dei piani di addestramento flessibili per l'inferenza di SageMaker AI è disponibile nelle regioni seguenti: Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), Stati Uniti orientali (Ohio).

Per saperne di più sull'utilizzo delle prenotazioni FTP per gli endpoint di inferenza, consulta la pagina di riferimento all'API per l'inferenza di SageMaker AI qui.