SageMaker HyperPod unterstützt nun eine detaillierte Zuteilung von Rechenressourcen
Die SageMaker HyperPod-Aufgaben-Governance unterstützt nun eine detaillierte Zuweisung von Rechenquoten für GPU, Trainium-Beschleuniger, vCPU und vCPU-Speicher innerhalb einer Instance. Administratoren können detaillierte Rechenkontingente für Teams zuweisen, um die Verteilung der Rechenressourcen zu optimieren und das Budget einzuhalten.
Datenwissenschaftler führen häufig LLM-Aufgaben wie Training oder Inferenz aus, für die keine vollständigen HyperPod-Instances erforderlich sind, was zu einer unzureichenden Auslastung der beschleunigten Rechenressourcen führt. Mit der HyperPod-Aufgaben-Governance können Administratoren die Zuweisung von Rechenquoten teamübergreifend verwalten. Mit dieser Funktion können Administratoren nun Rechenressourcen strategisch zuweisen, einen fairen Zugriff gewährleisten, eine Monopolisierung der Ressourcen verhindern und die Clusterauslastung maximieren. Diese Funktion ermöglicht neben der Zuweisung auf Instance-Ebene auch eine detaillierte Zuweisung von Rechenkontingenten, die sich an den Workload-Anforderungen des Unternehmens orientiert.
SageMaker HyperPod-Aufgaben-Governance ist in allen AWS-Regionen verfügbar, in denen HyperPod verfügbar ist: USA Ost (Nord-Virginia), USA West (Nordkalifornien), USA West (Oregon), Asien-Pazifik (Mumbai), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney) und Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Stockholm) und Südamerika (São Paulo).
Weitere Informationen finden Sie auf der SageMaker HyperPod-Webseite und in der Dokumentation zur HyperPod-Aufgaben-Governance.