La governance delle attività è ora disponibile al pubblico per Amazon SageMaker HyperPod
Amazon SageMaker HyperPod offre ora una governance centralizzata per tutte le attività di sviluppo di IA generativa, come l'addestramento e l'inferenza. Hai piena visibilità e controllo sull'allocazione delle risorse di calcolo, garantendo la priorità delle attività più critiche e massimizzando l'utilizzo delle risorse di calcolo, riducendo i costi di sviluppo del modello fino al 40%.
Con la governance delle attività di HyperPod, gli amministratori possono definire più facilmente le priorità per le diverse attività e impostare limiti per il numero di risorse di calcolo che ogni team può utilizzare. In qualsiasi momento, gli amministratori possono anche monitorare e verificare le attività in esecuzione o in attesa di risorse di calcolo tramite un pannello di controllo intuitivo. Quando i data scientist creano le proprie attività, HyperPod le esegue automaticamente, rispettando i limiti e le priorità delle risorse di calcolo definiti. Ad esempio, quando l'addestramento per un modello ad alta priorità deve essere completato il prima possibile ma tutte le risorse di calcolo sono in uso, HyperPod libera le risorse dalle attività con priorità inferiore per supportare l'addestramento. HyperPod sospende l'attività a bassa priorità, salva il checkpoint e rialloca le risorse di calcolo liberate. L'attività prescelta a bassa priorità riprenderà dall'ultimo checkpoint salvato non appena le risorse saranno nuovamente disponibili. Inoltre, quando un team non utilizza appieno i limiti di risorse impostati dall'amministratore, HyperPod utilizza quelle risorse inattive per accelerare le attività di un altro team. Oltre a ciò, HyperPod è ora integrato con Amazon SageMaker Studio, integrando la governance delle attività e altre funzionalità HyperPod nell'ambiente Studio. I data scientist possono ora interagire senza problemi con i cluster HyperPod direttamente da Studio, consentendo loro di sviluppare, inviare e monitorare processi di machine learning (ML) su potenti cluster supportati da acceleratori.
La governance delle attività per HyperPod è disponibile in tutte le regioni AWS in cui HyperPod è disponibile: Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (California settentrionale), Stati Uniti occidentali (Oregon), Asia Pacifico (Mumbai), Asia Pacifico (Singapore), Asia Pacifico (Sydney) e Asia Pacifico (Tokyo), Europa (Francoforte), Europa (Irlanda), Europa (Londra), Europa (Stoccolma) e Sud America (San Paolo).
Per saperne di più, visita la pagina web di SageMaker HyperPod, il blog delle novità di AWS e la documentazione sull'IA di SageMaker.