Veröffentlicht am: Sep 28, 2023

Amazon-EC2-P5-Instances, die die höchste Leistung in Amazon EC2 für Deep Learning- und High Performance Computing (HPC)-Anwendungen bieten, sind jetzt in der Region USA Ost (Ohio) verfügbar.

Sie können P5-Instances für das Training und die Bereitstellung von immer komplexeren großen Sprachmodellen (LLMs) und Diffusionsmodellen verwenden, die die anspruchsvollsten generativen KI-Anwendungen antreiben. Dazu gehören die Beantwortung von Fragen, Codegenerierung, Video- und Bildgenerierung, Spracherkennung und mehr. Sie können P5-Instances auch verwenden, um anspruchsvolle HPC-Anwendungen in großem Maßstab für die pharmazeutische Forschung, seismische Analyse, Wettervorhersage und Finanzmodellierung bereitzustellen.

P5-Instances werden von den neuesten NVIDIA H100 Tensor Core GPUs angetrieben und bieten im Vergleich zu GPU-basierten Instances der vorherigen Generation eine doppelt so hohe CPU-Leistung, einen doppelt so großen Systemspeicher und einen vierfach höheren lokalen Speicher. Sie bieten marktführende Scale-Out-Fähigkeiten für verteiltes Training und eng gekoppelte HPC-Workloads mit bis zu 3.200 Gbit/s an Netzwerken mithilfe der Elastic Fabric Adapter (EFA)-Technologie der zweiten Generation. Um den Kundenanforderungen nach großem Umfang bei geringer Latenz gerecht zu werden, werden P5-Instances in Amazon EC2 UltraClustern bereitgestellt, die eine nicht blockierende Verbindung im Petabit-Maßstab zwischen bis zu 20.000 H100-GPUs bieten.

Mit dieser regionalen Erweiterung sind P5-Instances von Amazon EC2 nun auch in den Regionen USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon) verfügbar.

Weitere Informationen zu P5-Instances finden Sie unter Amazon EC2 P5-Instances.