Veröffentlicht am: Feb 1, 2024
Heute gibt Amazon Web Services bekannt, dass Amazon Elastic Compute Cloud (Amazon EC2) Capacity Blocks for ML jetzt P5-Instances in der Region USA Ost (Nord-Virginia) und P4d-Instances in den Regionen USA Ost (Ohio) und USA West (Oregon) unterstützt. Sie können EC2 Capacity Blocks verwenden, um stark nachgefragte GPU-Instances in Amazon EC2 UltraClustern für einen späteren Zeitpunkt für die Zeit zu reservieren, die Sie für die Ausführung Ihrer Machine-Learning-Workloads (ML) benötigen.
Mit EC2 Capacity Blocks können Sie GPU-Kapazität bis zu acht Wochen im Voraus für einen Zeitraum von einem bis 14 Tagen in Clustergrößen von einer bis 64 Instances (512 GPUs) reservieren, sodass Sie flexibel eine Vielzahl von ML-Workloads ausführen können. Sie eignen sich ideal für kurze Pre-Trainings und die Feinabstimmung von Workloads, das schnelle Prototyping und für den Umgang mit steigenden Inferenzanforderungen. EC2 Capacity Blocks bieten Konnektivität mit niedriger Latenz und hohem Durchsatz durch Co-Location in Amazon EC2 UltraClustern.
Mit dieser Erweiterung sind EC2 Capacity Blocks for ML für die folgenden Instance-Typen und AWS-Regionen verfügbar: P5-Instances in den Regionen USA Ost (Nord-Virginia) und USA Ost (Ohio); P4d-Instances in den Regionen USA Ost (Ohio) und USA West (Oregon).
Besuchen Sie zunächst die AWS-Managementkonsole, das AWS Command Line Interface (AWS CLI), und die AWS-SDKs. Weitere Informationen finden Sie im Amazon EC2 Capacity Blocks for ML-Benutzerhandbuch.