Veröffentlicht am: Oct 17, 2023

Wir freuen uns, die Vorversion der ml.p4d-, ml.trn1- und ml.g5-Instances in neuen Regionen für asynchrone Inferenz von Modellen für Machine Learning (ML) in Echtzeit auf Amazon SageMaker ankündigen zu können. Diese Instanzen sind auch in anderen Regionen allgemein als Inferenz verfügbar.

  • ml.p4d.24xlarge-Instances, die jetzt als Vorversion in den Regionen AWS GovCloud (USA West), Europa (Irland), Asien-Pazifik (Tokio) und Asien-Pazifik (Singapur) verfügbar sind, bieten eine hohe Leistung für Deep-Learning-Modelle. Mit 40 GB Arbeitsspeicher pro Nvidia A100-GPU ermöglichen P4d-Instances leistungsstarke Inferenzen für Machine Learning bei großen Modellen und generativen KI-Anwendungsfällen.
  • ml.trn1-Instances, die jetzt als Vorversion in USA West (Oregon) verfügbar sind, bieten Unterstützung für leistungsstarke Inferenz-Workloads auf Deep-Learning-Modellen mit mehr als 100 B+ Parametern und generativen KI-Modellen, die Anwendungen wie Textzusammenfassung, Codegenerierung und Beantwortung von Fragen umfassen.
  • ml.g5-Instances, die jetzt als Vorversion in Asien-Pazifik (Seoul) und Südamerika (Sao Paulo) verfügbar sind, eignen sich ideal für Anwendungsfälle wie Empfehlungen, Chatbots, intelligente Assistenten und Bilderkennung.

Um auf diese Vorversionen zugreifen zu können, fordern Sie einfach die Erhöhung der Grenzwerte über AWS-Service Quotas an. Preisinformationen zu diesen Instances finden Sie auf unserer Preisseite. Weitere Informationen zur Bereitstellung von Modellen mit SageMaker finden Sie in der Übersicht und in der Dokumentation. Weitere Informationen zu den Instances in der Vorversion finden Sie auf der G5-Produktseite, der Trn1-Produktseite und der P4-Produktseite.