SageMaker HyperPod ora supporta l'allocazione granulare delle quote delle risorse di calcolo

Inserito il: 14 ago 2025

La governance delle attività di SageMaker HyperPod ora supporta l'allocazione granulare delle quote di calcolo di GPU, Trainium accelerator, vCPU e memoria vCPU all'interno di un'istanza. Gli amministratori possono allocare quote di elaborazione granulari tra i team, ottimizzando la distribuzione delle risorse di calcolo e rispettando il budget.

I data scientist spesso eseguono attività LLM, come l'addestramento o l'inferenza, che non richiedono intere istanze HyperPod, con conseguente sottoutilizzo delle risorse di calcolo accelerate. La governance delle attività di HyperPod consente agli amministratori di gestire l'allocazione delle quote di calcolo tra i team. Grazie a questa funzionalità gli amministratori possono ora allocare strategicamente le risorse di calcolo, garantendo un accesso equo, prevenendo la monopolizzazione delle risorse e massimizzando l'utilizzo dei cluster. Questa funzionalità consente un'allocazione granulare delle quote di calcolo, oltre all'allocazione a livello di istanza, in linea con le esigenze del carico di lavoro dell'organizzazione.

La governance delle attività di SageMaker HyperPod è disponibile in tutte le regioni AWS in cui HyperPod è disponibile: Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (California settentrionale), Stati Uniti occidentali (Oregon), Asia Pacifico (Mumbai), Asia Pacifico (Singapore), Asia Pacifico (Sydney) e Asia Pacifico (Tokyo), Europa (Francoforte), Europa (Irlanda), Europa (Londra), Europa (Stoccolma) e Sud America (San Paolo).

Per saperne di più, consulta la pagina web di SageMaker HyperPod e la documentazione sulla governance delle attività di HyperPod.