Amazon SageMaker Serverless Inference ist jetzt allgemein verfügbar

Veröffentlicht am: Apr 21, 2022

Wir freuen uns, heute die allgemeine Verfügbarkeit von Amazon SageMaker Serverless Inference in allen AWS-Regionen bekannt zu geben, in denen SageMaker allgemein verfügbar ist (außer in den AWS-Regionen in China). Mit SageMaker Serverless Inference können Sie schnell Machine-Learning-Modelle (ML) für Inferenzen einsetzen, ohne die zugrunde liegende Infrastruktur konfigurieren oder verwalten zu müssen. Wählen Sie beim Bereitstellen Ihrer ML-Modelle einfach die Serverless-Option, und Amazon SageMaker stellt automatisch Rechenkapazität bereit, skaliert sie und schaltet sie ab, je nach Umfang der Inferenzanforderungen. Mit SageMaker Serverless Inference zahlen Sie nur für die zur Verarbeitung von Inferenzanforderungen genutzte Rechenkapazität (Abrechnung pro Millisekunde) und die verarbeitete Datenmenge, nicht aber für Leerlaufzeiten. SageMaker Serverless Inference ist ideal für Anwendungen mit unregelmäßigem oder unvorhersehbarem Datenverkehr.

Seit der Einführung der Vorversion auf der re:Invent 2021 haben wir die Unterstützung für Amazon SageMaker Python SDK hinzugefügt, das Abstraktionen zur Vereinfachung der Modellbereitstellung bietet, sowie die Unterstützung für Model Registry, mit der Sie Ihre Serverless-Inferenzendpunkte in Ihren MLOps-Workflow integrieren können. Wir haben außerdem die maximale Anzahl gleichzeitiger Aufrufe pro Endpunkt auf 200 erhöht (von 50 in der Vorversion), damit Sie SageMaker Serverless Inference für Workloads mit hohem Datenverkehr verwenden können.

Sie können einen SageMaker-Serverless-Inference-Endpunkt über die AWS-Konsole, AWS SDK for Python (Boto3), SageMaker Python SDK, AWS CloudFormation oder AWS Command Line Interface (AWS CLI) erstellen. SageMaker Serverless Inference ist jetzt in den folgenden 21 AWS-Regionen allgemein verfügbar: USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Nordkalifornien), USA West (Oregon), Afrika (Kapstadt), Asien-Pazifik (Hongkong), Asien-Pazifik (Mumbai), Asien-Pazifik (Osaka), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Kanada (Central), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Mailand), Europa (Paris), Europa (Stockholm), Naher Osten (Bahrain) und Südamerika (São Paulo).

Erste Schritte:

Sehen Sie sich den Blogbeitrag zu Amazon SageMaker Serverless Inference an
Lesen Sie das Entwicklerhandbuch zu SageMaker Serverless Inference
Laden Sie die Beispiel-Notebooks auf GitHub SageMaker Serverless Inference herunter
Besuchen Sie die Preisseite für Amazon SageMaker

Amazon SageMaker Serverless Inference ist jetzt allgemein verfügbar

Ende des Supports für Internet Explorer