Amazon SageMaker AI unterstützt nun P6e-GB200 UltraServer
Amazon SageMaker AI gibt heute die Unterstützung für P6e-GB200 UltraServer in SageMaker HyperPod und Trainingjobs bekannt. Mit P6e-GB200 UltraServern können Sie bis zu 72 NVIDIA Blackwell-GPUs unter einer NVLink-Domäne nutzen, um das Training und die Bereitstellung grundlegender Modelle im Billionen-Parameter-Maßstab zu beschleunigen. P6e-GB200 UltraServer sind in zwei Größen erhältlich: ml.u-p6e-gb200x72 (72 GPUs innerhalb von NVLink) und ml.u-p6e-gb200x36 (36 GPUs innerhalb von NVLink).
P6e-GB200 UltraServer bieten im Vergleich zu P5en-Instances mehr als 20-mal so viel Rechenleistung und mehr als 11-mal so viel Arbeitsspeicher unter einem NVIDIA NVLink. Innerhalb jeder NVLink-Domäne können Sie 360 Petaflops FP8-Rechenleistung (ohne Sparsity) und insgesamt 13,4 TB Hochbandbreitenspeicher (HBM3e) nutzen. Wenn Sie P6e-GB200 UltraServer auf SageMaker AI einsetzen, profitieren Sie von der überragenden Leistung des GB200 in Kombination mit der verwalteten Infrastruktur von SageMaker, darunter Sicherheit, integrierte Fehlertoleranz, topologiebewusste Planung (SageMaker HyperPod EKS und Slurm), integrierte Überwachungsfunktionen und native Integration mit anderen SageMaker AI- und AWS-Services.
Die UltraServer sind über SageMaker Flexible Training Plans in der lokalen Zone Dallas („us-east-1-dfw-2a“) verfügbar, einer Erweiterung der AWS-Region USA Ost (Nord-Virginia). Für die On-Demand-Reservierung von GB200 UltraServers wenden Sie sich bitte an Ihren Account Manager. Mit Amazon SageMaker AI können Sie Machine-Learning-Modelle mithilfe einer vollständig verwalteten Infrastruktur, die für Leistung und Kosten optimiert ist, problemlos in großem Maßstab trainieren und einsetzen. Um mit UltraServers auf SageMaker AI zu beginnen, besuchen Sie bitte die Dokumentation.