Amazon SageMaker HyperPod beschleunigt die Bereitstellung von Open-Weight-Modellen

Veröffentlicht am: 10. Juli 2025

Amazon SageMaker HyperPod unterstützt jetzt die Bereitstellung von sowohl Open-Weight-Basismodellen aus Amazon SageMaker JumpStart als auch Ihrer eigenen optimierten Modelle aus Amazon S3 und Amazon FSx direkt auf Amazon SageMaker HyperPod. Auf diese Weise können Sie Modelle nahtlos auf denselben HyperPod-Rechenressourcen trainieren, optimieren und bereitstellen und so die Ressourcennutzung über den gesamten Modelllebenszyklus hinweg maximieren.

In wenigen Schritten können Sie aus SageMaker JumpStart ein Open-Weight-Basismodell auswählen und es schnell auf Ihrem SageMaker HyperPod-Cluster bereitstellen. SageMaker stellt automatisch die Infrastruktur bereit, stellt das Modell auf Ihrem Cluster bereit, aktiviert die automatische Skalierung und konfiguriert den SageMaker-Endpunkt. SageMaker skaliert die Rechenressourcen über HyperPod Task Governance hoch und runter, wenn sich der Traffic auf den Modell-Endpunkten ändert, und veröffentlicht automatisch Metriken im HyperPod-Beobachtbarkeits-Dashboard, um einen vollständigen Überblick über die Modellleistung zu bieten.

Sie können Modelle aus SageMaker JumpStart in allen AWS-Regionen bereitstellen, in denen HyperPod verfügbar ist: USA Ost (Nord-Virginia), USA West (Nordkalifornien), USA West (Oregon), Asien-Pazifik (Mumbai), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney) und Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Stockholm) und Südamerika (São Paulo).

Um mehr zu erfahren, besuchen Sie die SageMaker HyperPod-Webseite, den Blog und die Dokumentation.