G7e-Instances von Amazon EC2 sind jetzt allgemein verfügbar
Heute kündigt Amazon die allgemeine Verfügbarkeit von G7e-Instances von Amazon Elastic Compute Cloud (Amazon EC2) an, die durch NVIDIA RTX PRO 6000 Blackwell Server Edition-GPUs beschleunigt werden. G7e-Instances bieten im Vergleich zu G6e eine bis zu 2,3-fache Inferenzleistung.
Kunden können G7e-Instances verwenden, um große Sprachmodelle (LLMs), agentenbasierte KI-Modelle, multimodale generative KI-Modelle und physische KI-Modelle bereitzustellen. G7e-Instances bieten die höchste Leistung für Spatial-Computing-Workloads sowie für Workloads, die sowohl Grafik- als auch KI-Verarbeitungsfunktionen erfordern. G7e-Instances verfügen über bis zu 8 NVIDIA RTX PRO 6000 Blackwell Server Edition-GPUs mit 96 GB Arbeitsspeicher pro GPU und Intel Xeon-Prozessoren der 5. Generation. Sie unterstützen bis zu 192 virtuelle CPUs (vCPUs) und bis zu 1.600 Gbit/s Elastic Fabric Adapter-Netzwerkbandbreite. G7e-Instances unterstützen NVIDIA GPUDirect Peer to Peer (P2P), das die Leistung für Workloads mit mehreren GPUs steigert. G7e-Instances mit mehreren GPUs unterstützen auch NVIDIA GPUDirect Remote Direct Memory Access (RDMA) mit eFAV4 in EC2-UltraClustern, wodurch die Latenz für kleine Workloads mit mehreren Knoten reduziert wird.
Sie können G7e-Instances für Amazon EC2 in den folgenden AWS-Regionen verwenden: USA Ost (Nord-Virginia) und USA Ost (Ohio). Kunden können G7e-Instances als On-Demand-Instances, Spot Instances oder als Teil von Savings Plans erwerben.
Nutzen Sie für den Einstieg die AWS-Managementkonsole, die AWS-Befehlszeilenschnittstelle (CLI) und die AWS-SDKs. Um mehr zu erfahren, besuchen Sie die Seite zu G7e-Instances.