Warum Amazon-EC2-UltraCluster?
Amazon Elastic Compute Cloud (Amazon EC2)-UltraCluster können Sie bei der Skalierung auf Tausende von GPUs oder speziell entwickelten ML-KI-Chips wie AWS Trainium unterstützen, um bei Bedarf Zugriff auf einen Supercomputer zu erhalten. Sie demokratisieren den Zugang zu Supercomputing-Leistung für Entwickler von Machine Learning (ML), generativer KI und High Performance Computing (HPC) durch ein einfaches nutzungsabhängiges Nutzungsmodell ohne Einrichtungs- oder Wartungskosten. Zu den Amazon-EC2-Instances, die in EC2 UltraClusters bereitgestellt werden, gehören P6e-GB200-, P6-B200-, P5en-, P5e-, P5-, P4d-, Trn2- und Trn1-Instances.
EC2-UltraCluster bestehen aus Tausenden von beschleunigten EC2-Instances, die sich in einer bestimmten AWS Availability Zone befinden und über Elastic Fabric Adapter (EFA)-Netzwerke in einem nicht blockierenden Netzwerk im Petabit-Bereich miteinander verbunden sind. EC2 UltraCluster bieten auch Zugriff auf Amazon FSx for Lustre, einen vollständig verwalteten gemeinsamen Speicher, der auf dem beliebtesten leistungsstarken, parallelen Dateisystem basiert, um riesige Datensätze schnell und bedarfsgerecht mit Latenzen von unter einer Millisekunde zu verarbeiten. EC2-UltraCluster bieten Scale-Out-Funktionen für verteiltes ML-Training und eng gekoppelte HPC-Workloads.
Vorteile
Funktionen
Unterstützte Instances und UltraServer
Hast du die gewünschten Informationen gefunden?
Dein Beitrag hilft uns, die Qualität der Inhalte auf unseren Seiten zu verbessern.