Veröffentlicht am: Oct 17, 2023
Wir freuen uns, die allgemeine Verfügbarkeit von ml.p4d-Instances in Asien-Pazifik (Tokio) und Europa (Frankfurt) bekannt zu geben, um Modelle für Machine Learning (ML) für Echtzeit- und asynchrone Inferenz auf Amazon SageMaker bereitzustellen.
ml.p4d.24xlarge-Instances bieten eine hohe Leistung für Deep-Learning-Modelle. Mit 40 GB Arbeitsspeicher pro Nvidia A100-GPU ermöglichen P4d-Instances leistungsstarke Inferenzen für Machine Learning bei großen Modellen und generative KI in Anwendungen wie der Verarbeitung natürlicher Sprache, Objekterkennung und Empfehlungsmaschinen.
Benutzer können ab sofort mit der Bereitstellung von Modellen zur Inferenz für ml.p4d-Instances in Asien-Pazifik (Tokio) und Europa (Frankfurt) auf SageMaker beginnen. Preisinformationen zu diesen Instances finden Sie auf unserer Preisseite. Weitere Informationen zur Bereitstellung von Modellen mit SageMaker finden Sie in der Übersicht und in der Dokumentation. Weitere Informationen zu den p4d-Instances finden Sie auf der P4-Produktseite.