AWS Batch unterstützt ab sofort Kontingentverwaltung und Präemption für SageMaker-Trainingsjobs

Veröffentlicht am: 25. März 2026

AWS Batch unterstützt jetzt die Kontingentverwaltung mit Jobpräemption für SageMaker-Trainingsjobs, sodass Sie Rechenressourcen effizient zuweisen und übergreifend über die Teams und Projekten gemeinsam nutzen können. Wenn Sie GPU-Kapazität in SageMaker-Trainingsjobs verwenden, können Sie jetzt Rechenressourcen intelligent zuweisen, geschäftskritische Trainingsjobs priorisieren und Workloads mit niedrigerer Priorität automatisch verhindern, wenn dringenden Experimente eintreffen.

Mit der Kontingentverwaltung erstellen Sie bis zu 20 Kontingentanteile pro Jobwarteschlange, die als virtuelle Warteschlangen mit dedizierten Kapazitätsgrenzen und konfigurierbaren Strategien zur gemeinsamen Ressourcennutzung dienen. Der Service nutzt automatisch Cross-Share-Präemption, um geliehene Kapazitäten wiederherzustellen, wenn der ursprüngliche Eigentümer Jobs einreicht, und unterstützt die In-Share-Präemption, damit Jobs mit hoher Priorität Aufträge mit niedrigerer Priorität innerhalb derselben Kontingentbeteiligung verhindern können. Sie können die Kapazitätsauslastung in der Warteschlange, die Kontingentverteilung und die Granularität auf Jobebene überwachen, die Jobprioritäten nach der Übermittlung aktualisieren, um Entscheidungen in Bezug auf die Präemption zu beeinflussen, und zur Steuerung des Verhaltens Grenzwerte für Wiederholungsversuche konfigurieren. Das Feature lässt sich über das Modul aws_batch direkt in das SageMaker Python SDK integrieren.

Kontingentmanagement mit Jobpräemption für SageMaker-Trainingsjobs ist ab sofort in allen AWS-Regionen verfügbar, in denen AWS Batch zur Verfügung steht. Weitere Informationen finden Sie in unserem Beispielnotebook für das Kontingentmanagement auf GitHub und im AWS-Batch-Benutzerhandbuch.