Amazon EC2 Single GPU P5-Instances sind nun allgemein verfügbar

Veröffentlicht am: 12. Aug. 2025

Heute kündigt AWS eine neue Instance-Größe für Amazon Elastic Compute Cloud (Amazon EC2) P5 mit einer NVIDIA H100 GPU an, mit der Unternehmen ihre Ressourcen für Machine Learning (ML) und High-Performance-Computing (HPC) kosteneffizient dimensionieren können.

Dank der neuen Instance-Größe können Kunden klein beginnen und in kleinen Schritten skalieren, wodurch sie ihre Infrastrukturkosten flexibler kontrollieren können. Kunden, die kleine bis mittelgroße große Sprachmodelle (LLMs) wie Chatbots oder spezialisierte Sprachübersetzungstools entwickeln, können nun Inferenzaufgaben kostengünstiger ausführen. Kunden können diese Instanzen auch nutzen, um HPC-Anwendungen für die pharmazeutische Forschung, Strömungsanalyse und Finanzmodellierung bereitzustellen, ohne sich auf kostspielige, groß angelegte GPU-Bereitstellungen festlegen zu müssen.

P5.4xlarge-Instances sind jetzt über Amazon EC2 Capacity Blocks für ML in den folgenden AWS-Regionen verfügbar: USA Ost (Nord-Virginia, Ohio), USA West (Oregon), Europa (London), Asien-Pazifik (Mumbai, Sydney, Tokio) und Südamerika (Sao Paulo). Diese Instances können On-Demand, Spot oder über Sparpläne in den Regionen Europa (London), Asien-Pazifik (Mumbai, Jakarta, Tokio) und Südamerika (Sao Paulo) erworben werden.

Weitere Informationen zu P5.4xlarge-Instances finden Sie unter Amazon-EC2-P5-Instances.

Amazon EC2 Single GPU P5-Instances sind nun allgemein verfügbar

Lernen

Ressourcen

Entwickler

Hilfe