Amazon SageMaker HyperPod ora convalida le quote di servizio prima di creare cluster nella console
La console di Amazon SageMaker HyperPod ora convalida le quote di servizio dell'account AWS prima di avviare la creazione del cluster, consentendo di verificare la disponibilità di quote sufficienti prima dell'inizio del provisioning. SageMaker HyperPod aiuta a eseguire il provisioning di cluster resilienti per l'esecuzione di carichi di lavoro IA/ML e lo sviluppo di modelli all'avanguardia come modelli linguistici di grandi dimensioni (LLM), modelli di diffusione e modelli di fondazione (FM).
Durante la creazione di cluster IA/ML su larga scala, è necessario verificare che l'account disponga di quote sufficienti per istanze, archiviazione e risorse di rete, ma in precedenza la convalida delle quote richiedeva controlli manuali su più servizi AWS, causando frequenti fallimenti nella creazione dei cluster e sprechi di tempo dovuti alla mancata richiesta tempestiva di aumento dei limiti delle quote. La nuova funzionalità di convalida delle quote nella console di SageMaker HyperPod verifica automaticamente le quote a livello di account rispetto alla configurazione del cluster, inclusi i limiti dei tipi di istanza, le dimensioni dei volumi EBS e le quote relative al VPC, durante la creazione di nuove risorse. La convalida mostra una tabella chiara con l'utilizzo previsto, i valori di quota applicati e lo stato di conformità per ciascuna quota. In caso di possibile superamento delle quote, il sistema genera un avviso contenente collegamenti diretti alla console Service Quotas che consentono di richiedere l'aumento dei limiti.
Questa funzionalità è disponibile in tutte le regioni AWS in cui è supportato Amazon SageMaker HyperPod. Per un elenco completo dei controlli di convalida delle quote di servizio eseguiti, consulta la guida utente di Amazon SageMaker HyperPod.