Amazon SageMaker HyperPod überprüft jetzt Servicekontingente vor der Erstellung von Clustern auf der Konsole
Die Amazon-SageMaker-HyperPod-Konsole validiert jetzt die Servicekontingente für Ihr AWS-Konto, bevor Sie mit der Cluster-Erstellung beginnen, sodass Sie die Verfügbarkeit ausreichender Kontingente überprüfen können, bevor die Bereitstellung beginnt. SageMaker HyperPod unterstützt Sie bei der Bereitstellung robuster Cluster für die Ausführung von KI/Machine Learning (ML)-Workloads und die Entwicklung hochmoderner Modelle wie große Sprachmodelle (LLMs), Diffusionsmodelle und Basismodelle (FMs).
Bei der Erstellung umfangreicher KI/ML-Cluster müssen Sie sicherstellen, dass Ihr Konto über ausreichende Kontingente für Instances, Speicher- und Netzwerkressourcen verfügt. Für die Kontingentvalidierung waren jedoch zuvor manuelle Prüfungen für mehrere AWS-Services erforderlich, was häufig zum Fehlschlag von Cluster-Erstellungen und zu Zeitverschwendung führte, wenn Sie die Erhöhung des Kontingentlimits nicht beantragen. Die neue Funktion zur Kontingentvalidierung in der SageMaker-HyperPod-Konsole vergleicht Ihre Kontingente auf Kontoebene automatisch mit Ihrer Cluster-Konfiguration, einschließlich Instance-Typbeschränkungen, EBS-Volume-Größen und VPC-bezogenen Kontingenten beim Erstellen neuer Ressourcen. Bei der Validierung wird eine übersichtliche Tabelle mit der erwarteten Auslastung, den angewendeten Kontingentwerten und dem Konformitätsstatus für jedes Kontingent angezeigt. Wenn Kontingente wahrscheinlich überschritten werden, erhalten Sie eine Warnung mit direkten Links zur Service Quotas-Konsole, um Erhöhungen anzufordern.
Diese Funktion ist in allen AWS-Regionen verfügbar, in denen Amazon SageMaker HyperPod unterstützt wird. Eine vollständige Liste der durchgeführten Überprüfungen der Servicekontingentvalidierung finden Sie im Benutzerhandbuch zu Amazon SageMaker HyperPod.