Task Governance ist jetzt für Amazon SageMaker HyperPod allgemein verfügbar

Veröffentlicht am: 4. Dez. 2024

Amazon SageMaker HyperPod bietet Ihnen jetzt eine zentrale Governance für alle Aufgaben im Zusammenhang mit der Entwicklung generativer KI wie Training und Inferenz. Sie haben vollen Überblick und Kontrolle über die Zuweisung von Rechenressourcen. Auf diese Weise gewährleisten Sie, dass die kritischsten Aufgaben priorisiert werden, und maximieren die Auslastung der Rechenressourcen, sodass die Kosten für die Modellentwicklung um bis zu 40 % gesenkt werden.

Mit HyperPod Task Governance können Administratoren auf einfache Weise Prioritäten für unterschiedliche Aufgaben definieren und die Anzahl der Rechenressourcen begrenzen, die jedes Team verwenden kann. Administratoren haben auch jederzeit die Möglichkeit, laufende oder auf Rechenressourcen wartende Aufgaben, über ein visuelles Dashboard zu überwachen und zu prüfen. Wenn Datenwissenschaftler ihre Aufgaben erstellen, führt HyperPod diese automatisch aus, unter Einhaltung der definierten Limits und Prioritäten für Rechenressourcen. Wenn beispielsweise das Training eines Modells mit hoher Priorität innerhalb kürzester Zeit abgeschlossen werden muss, aber alle Rechenressourcen belegt sind, wird HyperPod Ressourcen für Aufgaben mit niedrigerer Priorität freigeben, um das Training zu unterstützen. HyperPod unterbricht die Aufgabe niederer Priorität, speichert den Kontrollpunkt und verteilt die freigewordenen Rechenressourcen neu. Sobald die Ressourcen wieder verfügbar sind, wird die unterbrochene Aufgabe niederer Priorität ab dem zuletzt gespeicherten Kontrollpunkt wieder aufgenommen. Und wenn ein Team die vom Administrator festgelegten Ressourcenlimits nicht vollständig ausschöpft, nutzt HyperPod die nicht genutzten Ressourcen, um die Aufgaben eine andere Teamaufgabe zu beschleunigen. Darüber hinaus ist HyperPod jetzt in Amazon SageMaker Studio integriert, sodass Task Governance und andere HyperPod-Funktionen in die Studio-Umgebung eingebracht werden. Datenwissenschaftler können jetzt direkt von Studio aus nahtlos mit HyperPod-Clustern interagieren, um Machine-Learning-Jobs (ML) auf leistungsstarken, vom Beschleuniger gestützen Clustern zu entwickeln, zu übertragen und zu überwachen.

Task Governance für HyperPod ist in allen AWS-Regionen verfügbar, in denen HyperPod verfügbar ist: USA Ost (Nord-Virginia), USA West (Nordkalifornien), USA West (Oregon), Asien-Pazifik (Mumbai), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney) und Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Stockholm) und Südamerika (São Paulo).

Weitere Informationen finden Sie auf der SageMaker-HyperPod-Webseite, im AWS-News Blog und in der SageMaker-KI-Dokumentation.