Veröffentlicht am: Oct 17, 2023
Wir freuen uns, die Vorversion der ml.p5.48xlarge-Instances für die Bereitstellung von Machine Learning (ML)-Modellen für Echtzeit- und asynchrone Inferenzen auf Amazon SageMaker anzukündigen.
Mit 80 GB Arbeitsspeicher pro NVIDIA H100 Tensor Core-GPU (640 GB insgesamt), 30 TB lokalem NVMe-SSD-Speicher, 192 vCPUs und 2 TiB Instance-Speicher sind ml.p5.48xlarge-Instances so konzipiert, dass sie leistungsstarke Inferenzen für Machine Learning bei rechenintensiven KI-Workloads wie der Beantwortung von Fragen, Codegenerierung, Video- und Bildgenerierung sowie Spracherkennung ermöglichen.
Die ml.p5.48xlarge-Instances sind jetzt für die Verwendung auf SageMaker in den USA Ost (Nord-Virginia) und USA West (Oregon) verfügbar.
Um Zugriff auf die Vorversion zu erhalten, fordern Sie einfach eine Limiterhöhung über AWS Service Quotas an. Preisinformationen zu diesen Instances finden Sie auf unserer Preisseite. Weitere Informationen zur Bereitstellung von Modellen mit SageMaker finden Sie in der Übersicht und in der Dokumentation. Um mehr über P5-Instances im Allgemeinen zu erfahren, besuchen Sie die P5-Produktseite.