Amazon SageMaker unterstützt Datenwissenschaftler und Entwickler bei der Vorbereitung, der Erstellung, dem Training und der Bereitstellung hochwertiger Machine Learning (ML)-Modelle durch eine breite Palette von speziell für ML entwickelten Funktionen. SageMaker unterstützt die führenden ML-Frameworks, Toolkits und Programmiersprachen.

Mit SageMaker zahlen Sie nur für das, was Sie tatsächlich nutzen. Sie haben zwei Zahlungsmöglichkeiten: ein On-Demand-Preismodell, das keine Mindestgebühren und keine Vorausleistungen vorsieht, und die SageMaker-Savings-Plans, die ein flexibles, nutzungsbasiertes Preismodell im Austausch für die Verpflichtung zu einer kontinuierlichen Nutzungsmenge bieten.

Kostenloses Kontingent von Amazon SageMaker

Amazon SageMaker kostenlos testen. Im Rahmen des kostenlosen Kontingents für AWS können Sie Amazon SageMaker zum Einstieg kostenlos verwenden. Ihr kostenloses Kontingent startet mit dem ersten Monat, nachdem Sie Ihre erste SageMaker-Ressource erstellt haben. Die Details zum kostenlosen Kontingent für Amazon SageMaker sind in der Tabelle unten aufgeführt.

Fähigkeiten von Amazon SageMaker Nutzung eines kostenlosen Kontingents pro Monat für die ersten 2 Monate
Studio-Notebooks, und Notebook-Instances 250 Stunden ml.t3.-medium-Instance auf Studio-Notebooks ODER 250 Stunden ml.t2.-medium-Instance oder ml.t3.-medium-Instance auf Notebook-Instances
RStudio auf SageMaker 250 Stunden ml.t3.medium-Instance für die RSession-App UND kostenlose ml.t3.medium-Instance für die RStudioServerPro-App
Data Wrangler 25 Stunden der ml.m5.4xlarge-Instance
Feature Store 10 Millionen Schreibeinheiten, 10 Millionen Leseeinheiten, 25 GB Speicher (Standard-Online-Speicher)
Training 50 Stunden m4.xlarge- oder m5.xlarge-Instances
Amazon SageMaker mit TensorBoard 300 Stunden ml.r5.large-Instance
Echtzeit-Inferenz 125 Stunden m4.xlarge- oder m5.xlarge-Instances
Serverless-Inferenz 150 000 Sekunden Dauer der On-Demand-Inferenz
Canvas 160 Stunden/Monat für Sitzungszeit
HyperPod 50 Stunden der m5.xlarge-Instance

On-Demand-Preise

  • Studio Classic
  • Amazon SageMaker Studio Classic
    Studio Classic bietet Jupyter-Notebooks in einem Schritt in unserer alten IDE-Erfahrung. Die grundlegenden Rechenressourcen sind vollständig elastisch und die Notebooks können problemlos mit anderen geteilt werden, was eine nahtlose Zusammenarbeit ermöglicht. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.

  • JupyterLab
  • Amazon SageMaker JupyterLab
    Starten Sie das vollständig verwaltete JupyterLab in Sekundenschnelle. Verwenden Sie die neueste webbasierte interaktive Entwicklungsumgebung für Notebooks, Code und Daten. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.

  • Code-Editor
  • Amazon-SageMaker-Code-Editor
    Der auf Code-OSS (Visual Studio Code – Open Source) basierende Code-Editor ermöglicht es Ihnen, Ihren Analyse- und ML-Code zu schreiben, zu testen, zu debuggen und auszuführen. Es ist vollständig in SageMaker Studio integriert und unterstützt IDE-Erweiterungen, die in der Open VSX-Erweiterungsregistrierung verfügbar sind.

  • RStudio
  • RStudio
    RStudio bietet On-Demand-Cloud-Computing-Ressourcen, um die Modellentwicklung zu beschleunigen und die Produktivität zu verbessern. Ihnen werden die Instance-Typen in Rechnung gestellt, die Sie zum Ausführen der RStudio Session-App und der RStudio-Server-Pro-App auswählen.

    RStudioServerPro App

  • Notebook Instances
  • Notebook-Instances
    Notebook-Instances sind Instances für Datenverarbeitung, auf denen die Jupyter-Notebook-App ausgeführt wird. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.

  • Verarbeitung
  • Amazon SageMaker Processing
    Mit Amazon SageMaker Processing können Sie Ihre Workloads für Vor- und Nachverarbeitung sowie Modellauswertung problemlos in einer vollständig verwalteten Infrastruktur ausführen. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.

  • TensorBoard
  • Amazon SageMaker mit TensorBoard
    Amazon SageMaker mit TensorBoard bietet ein gehostetes TensorBoard-Erlebnis zur Visualisierung und Behebung von Modellkonvergenzproblemen für Amazon SageMaker-Schulungsaufträge.

  • Data Wrangler
  • Amazon SageMaker Data Wrangler

    Amazon SageMaker Data Wrangler reduziert den Zeitaufwand für die Aggregation und Aufbereitung von Daten für Machine Learning von Wochen auf Minuten. Sie zahlen für die Zeit, die für das Bereinigen, Durchsuchen und Visualisieren von Daten verwendet wird. Kunden, die SageMaker-Data-Wrangler-Instances ausführen, unterliegen den unten angegebenen Preisen.* Kunden, die SageMaker Data Wrangler auf SageMaker-Canvas-Workspace-Instances ausführen, unterliegen den SageMaker-Canvas-Preisen. Weitere Informationen finden Sie auf der Preisseite von SageMaker Canvas.

    Amazon SageMaker Data Wrangler – Aufgaben

    Eine Amazon SageMaker Data Wrangler-Aufgabe wird beim exportieren eines Datenstroms aus SageMaker Data Wrangler erstellt. Mit SageMaker Data Wrangler-Aufgaben können Sie Ihre Workflows zur Datenaufbereitung automatisieren. SageMaker Data Wrangler-Aufgaben helfen Ihnen, Ihre Datenaufbereitungs-Workflows zeitsparend auf neue Datensätze anzuwenden, und werden sekundengenau abgerechnet.

  • Feature Store
  • Amazon SageMaker Feature Store
    Amazon SageMaker Feature Store ist ein zentrales Repository zum Einlesen, Speichern und Bereitstellen von Features für Machine Learning. Schreib- und Lesezugriffe auf Feature-Gruppen und Datenspeicher im SageMaker Feature Store werden Ihnen in Rechnung gestellt, wobei sich die Preise für den Standard-Online-Speicher und den In-Memory-Online-Speicher unterscheiden.

     Für den Standard-Online-Speicher wird der Datenspeicher pro GB pro Monat berechnet. Für den Durchsatz können Sie zwischen dem bedarfsgesteuerten oder dem bereitgestellten Kapazitätsmodus wählen. Bei On-Demand werden Schreibvorgänge als Schreibanforderungseinheiten pro KB und Lesevorgänge als Leseanforderungseinheiten pro 4 KB berechnet. Im Modus der bereitgestellten Kapazität geben Sie die Lese- und Schreibkapazität an, die Ihre Anwendung voraussichtlich benötigt. Sagemaker Feature Store berechnet eine WCU für jedes Schreiben pro Sekunde (bis zu 1 KB) und eine RCU für jedes Lesen pro Sekunde (bis zu 4 KB). Ihnen wird die Durchsatzkapazität (Lese- und Schreibvorgänge) berechnet, die Sie für Ihre Feature-Gruppe bereitstellen, auch wenn Sie die bereitgestellte Kapazität nicht vollständig nutzen.

    Für den speicherinternen Online-Speicher werden Schreibvorgänge als Schreibanforderungseinheiten pro KB mit einem Minimum von 1 Einheit pro Schreibvorgang berechnet, Lesevorgänge werden als Leseanforderungseinheiten pro KB mit einem Minimum von 1 Einheit pro Lesevorgang berechnet, und die Datenspeicherung wird pro GB pro Stunde berechnet. Für den speicherinternen Online-Speicher wird eine Mindestgebühr von 5 GiB (5,37 GB) pro Stunde erhoben.

  • Training
  • Amazon SageMaker – Training
    Amazon SageMaker bietet alles, was Sie zum Trainieren, Optimieren und Debuggen von Modellen benötigen, und erleichtert so das Training von ML-Modellen (Machine Learning). Die Nutzung des von Ihnen gewählten Instance-Typs wird Ihnen in Rechnung gestellt. Wenn Sie Amazon SageMaker Debugger zum Debuggen von Problemen und Überwachen von Ressourcen während des Trainings verwenden, können Sie zum Debuggen Ihrer Trainingsaufgaben integrierte Regeln verwenden oder Ihre eigenen benutzerdefinierten Regeln schreiben. Die Verwendung der integrierten Regeln zum Debuggen Ihrer Trainingsaufgaben ist kostenlos. Bei benutzerdefinierten Regeln wird Ihnen der von Ihnen gewählte Instance-Typ auf der Grundlage der Nutzungsdauer in Rechnung gestellt.

  • MLflow
  • Amazon SageMaker mit MLflow
    Amazon SageMaker mit MLFlow ermöglicht es Kunden, nur für das zu bezahlen, was Sie nutzen. Kunden zahlen für MLflow-Tracking-Server auf der Grundlage der Rechen- und Speicherkosten.

    Kunden zahlen für die Datenverarbeitung auf der Grundlage der Größe des Tracking-Servers und der Anzahl der Betriebsstunden. Darüber hinaus zahlen Kunden für alle Metadaten, die auf dem MLflow-Tracking-Server gespeichert sind.

  • Echtzeit-Inferenz
  • Amazon SageMaker Hosting: Echtzeit-Inferenz
    Amazon SageMaker bietet Echtzeit-Inferenz für Ihre Anwendungsfälle, die Echtzeit-Vorhersagen benötigen. Die Nutzung des von Ihnen gewählten Instance-Typs wird Ihnen in Rechnung gestellt. Wenn Sie Amazon SageMaker Model Monitor zur Pflege hochpräziser Modelle verwenden, die Echtzeit-Inferenz bereitstellen, können Sie integrierte Regeln zur Überwachung Ihrer Modelle verwenden oder Ihre eigenen Regeln schreiben. Bei integrierten Regeln erhalten Sie bis zu 30 Stunden Überwachung kostenlos. Zusätzliche Gebühren werden nach der Dauer der Nutzung berechnet. Die Verwendung eigener benutzerdefinierter Regeln wird Ihnen separat in Rechnung gestellt.

  • Asynchrone Inferenz
  • Amazon SageMaker Asynchrone Inferenz:
    Amazon SageMaker Asynchronous Inference ist eine echtzeitnahe Inferenzoption, die eingehende Anforderungen in eine Warteschlange stellt und sie asynchron verarbeitet. Verwenden Sie diese Option, wenn Sie große Nutzdaten verarbeiten müssen, sobald die Daten eintreffen, oder wenn Sie Modelle ausführen, die lange Inferenzverarbeitungszeiten haben und keine Latenzzeiten von unter einer Sekunde benötigen. Die Kosten für die von Ihnen gewählte Instance werden Ihnen in Rechnung gestellt.

  • Batch-Transformation
  • Amazon SageMaker Batch Transform
    Mit Amazon SageMaker Batch Transform ist es nicht erforderlich, den Datensatz in einzelne Blöcke zu unterteilen oder Echtzeitendpunkte zu verwalten. Mit SageMaker Batch Transform können Sie Vorhersagen anhand großer oder kleiner Batch-Datensätze ausführen. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.

  • Serverless Inference
  • Amazon SageMaker Serverless Inference
    Mit Amazon SageMaker Serverless Inference können Sie Machine-Learning-Modelle für Inferenz bereitstellen, ohne die zugrunde liegende Infrastruktur konfigurieren oder verwalten zu müssen. Sie können entweder Serverless Inference auf Abruf verwenden oder Ihrem Endpunkt Provisioned Concurrency hinzufügen, um eine vorhersehbare Leistung zu erzielen.

    Bei On-Demand-Serverless-Inference bezahlen Sie nur für die Rechenkapazität, die für die Verarbeitung von Inferenz-Anforderungen verwendet wird, die nach Millisekunden und verarbeiteter Datenmenge abgerechnet wird. Die Computing-Gebühr hängt von der ausgewählten Arbeitsspeicher-Konfiguration ab.

    Bereitgestellte Nebenläufigkeit

    Optional können Sie Provisioned Concurrency auch für Ihre Serverless-Endpunkte aktivieren. Provisioned Concurrency (bereitgestellte Nebenläufigkeit) ermöglicht Ihnen die Bereitstellung von Modellen auf Serverless-Endpunkten mit vorhersehbarer Leistung und hoher Skalierbarkeit, indem Ihre Endpunkte für eine bestimmte Anzahl gleichzeitiger Anforderungen warm gehalten werden. Wie bei On-Demand-Serverless-Inferenz zahlen Sie, wenn Provisioned Concurrency aktiviert ist, für die zur Verarbeitung von Inferenzanfragen aufgewendete Rechenkapazität, die pro Millisekunde abgerechnet wird, und für die Menge der verarbeiteten Daten. Sie zahlen auch für die Nutzung von Provisioned Concurrency, basierend auf dem konfigurierten Speicher, der bereitgestellten Dauer und dem Umfang der aktivierten Nebenläufigkeit.

  • JumpStart
  • Amazon SageMaker JumpStart
    Amazon SageMaker JumpStart hilft Ihnen beim schnellen und einfachen Einstieg in das Machine Learning, indem Sie mit einem Klick auf beliebte Modellsammlungen (auch bekannt als „Modell-Zoos“) zugreifen können. JumpStart bietet auch End-to-End-Lösungen für gängige ML-Anwendungsfälle, die an Ihre Bedürfnisse angepasst werden können. Für die Nutzung von JumpStart-Modellen oder -Lösungen fallen keine zusätzlichen Gebühren an. Die Stunden für die zugrunde liegende Instance Training und Inference werden Ihnen genauso in Rechnung gestellt, wie wenn Sie sie manuell erstellt hätten.

  • Profiler
  • Amazon SageMaker Profiler erfasst Daten auf Systemebene zur Visualisierung von hochauflösenden CPU- und GPU-Trace-Plots. Dieses Tool wurde entwickelt, um Datenwissenschaftlern und Ingenieuren dabei zu helfen, hardwarebedingte Leistungsengpässe in ihren Deep-Learning-Modellen zu identifizieren und so Zeit und Kosten für umfassende Schulungen zu sparen. Derzeit unterstützt SageMaker Profiler nur die Profilerstellung von Trainingsaufträgen unter Nutzung der Trainings-Datenverarbeitungs-Instance-Typen ml.g4dn.12xlarge, ml.p3dn.24xlarge und ml.p4d.24xlarge.

    Regionen: USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon), Europa (Frankfurt), Europa (Irland) und Israel (Tel Aviv).

    Amazon SageMaker Profiler befindet sich derzeit in der Vorschauversion und ist nur für Kunden in unterstützten Regionen kostenlos verfügbar. 

  • HyperPod
  • Amazon SageMaker HyperPod
    Amazon SageMaker HyperPod wurde speziell entwickelt, um die Entwicklung von Foundation Models (FMs) zu beschleunigen. Um das FM-Training widerstandsfähiger zu machen, überwacht es kontinuierlich den Zustand des Clusters, repariert und ersetzt fehlerhafte Knoten im laufenden Betrieb und speichert häufige Checkpoints, um das Training automatisch fortzusetzen, ohne dass der Fortschritt verloren geht. SageMaker HyperPod ist mit verteilten SageMaker-Trainingsbibliotheken vorkonfiguriert, mit denen Sie die FM-Trainingsleistung verbessern und gleichzeitig die Computer- und Netzwerkinfrastruktur des Clusters voll ausnutzen können.

  • Inferenzoptimierung
  • Das Inferenzoptimierungs-Toolkit macht es Ihnen leicht, die neuesten Techniken zur Inferenzoptimierung zu implementieren, um eine Kostenleistung auf dem neuesten Stand der Technik (SOTA) auf Amazon SageMaker zu erzielen und gleichzeitig monatelange Entwicklerzeit zu sparen. Sie können aus einem Menü beliebter Optimierungstechniken von SageMaker wählen und Optimierungsaufträge im Voraus ausführen, das Modell auf Leistungs- und Genauigkeitsmetriken vergleichen und das optimierte Modell dann zur Inferenz auf einem SageMaker-Endpunkt bereitstellen.

Instance-Details

Produktdetails zur Amazon-SageMaker-P5-Instance

Instance-Größe vCPUs Instance-Arbeitsspeicher (TiB) GPU-Modell  GPU GPU-Speicher insgesamt (GB) Speicher pro GPU (GB) Netzwerkbandbreite (Gbit/s) GPUDirect RDMA GPU Peer-to-Peer Instance-Speicher (TB) EBS-Bandbreite (Gbit/s)
ml.p5.48xlarge 192 2 NVIDIA H100 8 640 HBM3 80 3200 EFAv2   Ja 900 GB/s NVSwitch   8x3.84 NVMe-SSD 80

Produktdetails zur Amazon-SageMaker-P4d-Instance

Instance-Größe vCPUs Instance-Arbeitsspeicher (GiB) GPU-Modell GPUs GPU-Speicher insgesamt (GB) Speicher pro GPU (GB) Netzwerkbandbreite (Gbit/s) GPUDirect RDMA GPU-Peer-to-Peer Instance-Speicher (GB) EBS-Bandbreite (GBit/s)
ml.p4d.24xlarge 96 1152 NVIDIA A100 8 320 HBM 2 40 400 ENA und EFA Ja 600 GB/s NVSwitch 8 x 1 000 NVMe SSD 19
ml.p4de.24xlarge 96 1152 NVIDIA A100 8 640 HNM2e 80 400 ENA und EFA Ja 600 GB/s NVSwitch 8X1000 NVMe-SSD 19

Amazon-SageMaker-P3-Instance – Produktdetails

Instance-Größe vCPUs Instance-Arbeitsspeicher (GiB) GPU-Modell GPUs GPU-Speicher insgesamt (GB) Speicher pro GPU (GB) Netzwerkbandbreite (Gbit/s) GPU Peer-to-Peer Instance-Speicher (GB) EBS-Bandbreite (Gbit/s)
ml.p3.2xlarge 8 61 NVIDIA V100 1 16 16 Bis zu 10 n. a. Nur EBS 1,5
ml.p3.8xlarge 32 244 NVIDIA V100 4 64 16 10 NVLink Nur EBS 7
ml.p3.16xlarge 64 488 NVIDIA V100 8 128 16 25 NVLink Nur EBS 14
ml.p3dn.24xlarge 96 768 NVIDIA V100 8 256 32 100 NVLink 2 x 900 NVMe-SSD 19

Produktdetails zur Amazon-SageMaker-P2-Instance

Instance-Größe vCPUs Instance-Arbeitsspeicher (GiB) GPU-Modell GPUs GPU-Speicher insgesamt (GB) Speicher pro GPU (GB) Netzwerkbandbreite (Gbit/s) EBS-Bandbreite (Gbit/s)
ml.p2.xlarge 4 61 NVIDIA K80 1 12 12 Bis zu 10 Hoch
ml.p2.8xlarge 32 488 NVIDIA K80 8 96 12 10 10
ml.p2.16xlarge 64 732 NVIDIA K80 16 192 12 25 20

Produktdetails zur Amazon-SageMaker-G4-Instance

Instance-Größe vCPUs Instance-Arbeitsspeicher (GiB) GPU-Modell GPUs GPU-Speicher insgesamt (GB) Speicher pro GPU (GB) Netzwerkbandbreite (Gbit/s) Instance-Speicher (GB) EBS-Bandbreite (GBit/s)
ml.g4dn.xlarge 4 16 NVIDIA T4 1 16 16 Bis zu 25 1 x 125 NVMe-SSD Bis zu 3,5
ml.g4dn.2xlarge 8 32 NVIDIA T4 1 16 16 Bis zu 25 1 x 125 NVMe-SSD Bis zu 3,5
ml.g4dn.4xlarge 16 64 NVIDIA T4 1 16 16 Bis zu 25 1 x 125 NVMe-SSD 4,75
ml.g4dn.8xlarge 32 128 NVIDIA T4 1 16 16 50 1 x 900 NVMe SSD 9,5
ml.g4dn.16xlarge 64 256 NVIDIA T4 1 16 16 50 1 x 900 NVMe SSD 9,5
ml.g4dn.12xlarge 48 192 NVIDIA T4 4 64 16 50 1 x 900 NVMe SSD 9,5

Amazon-SageMaker-G5-Instance – Produktdetails

Instance-Größe vCPUs Instance-Arbeitsspeicher (GiB) GPU-Modell GPUs GPU-Speicher insgesamt (GB) Speicher pro GPU (GB) Netzwerkbandbreite (Gbit/s) EBS-Bandbreite (GBit/s) Instance-Speicher (GB)
ml.g5n.xlarge 4 16 NVIDIA A10G 1 24 24 Bis zu 10 Bis zu 3,5 1 x 250
ml.g5.2xlarge 8 32 NVIDIA A10G 1 24 24 Bis zu 10 Bis zu 3,5 1 x 450
ml.g5.4xlarge 16 64 NVIDIA A10G 1 24 24 Bis zu 25 8 1 x 600
ml.g5.8xlarge 32 128 NVIDIA A10G 1 24 24 25 16 1 x 900
ml.g5.16xlarge 64 256 NVIDIA A10G 1 24 24 25 16 1 x 1900
ml.g5.12xlarge 48 192 NVIDIA A10G 4 96 24 40 16 1 x 3 800
ml.g5.24xlarge 96 384 NVIDIA A10G 4 96 24 50 19 1 x 3 800
ml.g5.48xlarge 192 768 NVIDIA A10G 8 192 24 100 19 2 x 3 800

Produktdetails zur Amazon-SageMaker-Trn1-Instance

Instance-Größe vCPUs Arbeitsspeicher (GiB) Trainium-Beschleuniger Beschleunigerspeicher gesamt (GB) Arbeitsspeicher pro Beschleuniger (GB) Instance-Speicher (GB) Netzwerkbandbreite (Gbit) EBS-Bandbreite (Gbit/s)
ml.trn1.2xlarge 8 32 1 32 32 1 x 500 NVMe SSD Bis zu 12,5 Bis zu 20
ml.trn1.32xlarge 128 512 16 512 32 4 x 2 000 NVMe-SSD 800 80

Produktdetails zur Amazon-SageMaker-Inf1-Instance

Instance-Größe vCPUs Arbeitsspeicher (GiB) Inferentia-Beschleuniger Beschleunigerspeicher gesamt (GB) Arbeitsspeicher pro Beschleuniger (GB) Instance-Speicher Inter-Beschleuniger-Verbindungen Netzwerkbandbreite (Gbit/s) EBS-Bandbreite (Gbit/s)
ml.inf1.xlarge 4 8 1 8 8 Nur EBS n.a. Bis zu 25 Bis zu 4,75
ml.inf1.2xlarge 8 16 1 8 8 Nur EBS n.a. Bis zu 25 Bis zu 4,75
ml.inf1.6xlarge 24 48 4 32 8 Nur EBS Ja 25 4,75
ml.inf1.24xlarge 96 192 16 128 8 Nur EBS ja 100 19

Produktdetails zur Amazon-SageMaker-Inf2-Instance

Instance-Größe vCPUs Arbeitsspeicher (GiB) Inferentia-Beschleuniger Beschleunigerspeicher gesamt (GB) Arbeitsspeicher pro Beschleuniger (GB) Instance-Speicher Inter-Beschleuniger-Verbindungen Netzwerkbandbreite (Gbit/s) EBS-Bandbreite (Gbit/s)
ml.inf2.xlarge 4 16 1 32 32 Nur EBS n.a. Bis zu 25 Bis zu 10
ml.inf2.8xlarge 32 128 1 32 32 Nur EBS n.a. Bis zu 25 10
ml.inf2.24xlarge 96 384 6 196 32 Nur EBS Ja 50 30
ml.inf2.48xlarge 192 768 12 384 32 Nur EBS Ja 100 60

Amazon SageMaker Studio

Amazon SageMaker Studio ist eine einzige webbasierte Oberfläche für die komplette ML-Entwicklung und bietet eine Auswahl an vollständig verwalteten integrierten Entwicklungsumgebungen (IDEs) und speziell entwickelten Tools. Sie können kostenlos auf SageMaker Studio zugreifen. Ihnen werden nur die zugrundeliegende Rechenleistung und der Speicher berechnet, die Sie für verschiedene IDEs und ML-Tools in SageMaker Studio verwenden.

Sie können viele Dienste von SageMaker Studio, AWS SDK für Python (Boto3) oder AWS Command Line Interface (AWS CLI) nutzen, darunter die folgenden:

  • IDEs auf SageMaker Studio zur Durchführung einer vollständigen ML-Entwicklung mit einer Vielzahl vollständig verwalteter IDEs, darunter JupyterLab, Code-OSS (Visual Studio Code – Open Source) und RStudio
  • SageMaker Pipelines zum Automatisieren und Verwalten von ML-Workflows
  • SageMaker Autopilot zum automatischen Erstellen von ML-Modellen mit voller Transparenz
  • SageMaker Experiments zum Organisieren und Verfolgen Ihrer Aufträge und Versionen
  • SageMaker Debugger zum Debuggen von Anomalien während des Trainings
  • SageMaker Model Monitor zur Aufrechterhaltung qualitativ hochwertiger Modelle
  • SageMaker Clarify zur besseren Erklärung Ihrer ML-Modelle und Verzerrungen zu erkennen
  • SageMaker JumpStart zur einfachen Bereitstellung von ML-Lösungen für viele Anwendungsfälle. Für die grundlegenden API-Aufrufe, die Amazon SageMaker in Ihrem Namen vornimmt, können Ihnen Gebühren von anderen in der Lösung verwendeten AWS-Services entstehen.
  • SageMaker Inference Recommender für Empfehlungen zur richtigen Endpunktkonfiguration

Sie zahlen nur für die grundlegenden Datenverarbeitungs- und Speicher-Ressourcen in SageMaker oder anderen AWS-Services, basierend auf Ihrer Nutzung.

Um Amazon Q Developer in JupyterLab verwenden zu können, müssen Sie Amazon Q Developer Pro abonnieren. Die Amazon Q Developer-Preise finden Sie hier.

Bewertungen des Basismodells

SageMaker Clarify unterstützt Bewertungen von Grundlagenmodellen sowohl mit automatischen als auch mit menschenbasierten Bewertungsmethoden. Jede von ihnen hat unterschiedliche Preise. Wenn Sie ein Grundlagenmodell von Amazon SageMaker JumpStart bewerten, das noch nicht in Ihrem Konto bereitgestellt ist, stellt SageMaker das JumpStart-Modell für die Dauer der Inferenz vorübergehend in einer SageMaker-Instance bereit. Die spezifische Instance entspricht der von JumpStart für dieses Modell bereitgestellten Instance-Empfehlung.

Automatische Bewertung:
Die Auswertungen von Grundlagenmodellen werden als SageMaker-Verarbeitungsauftrag ausgeführt. Der Bewertungsauftrag ruft SageMaker Inference auf. Den Kunden werden die Inferenz und der Bewertungsauftrag in Rechnung gestellt. Kunden werden nur für die Dauer des Bewertungsauftrags in Rechnung gestellt. Die Kosten des Bewertungsauftrags wären die Summe der Kosten pro Stunde der Bewertungs-Instance und der Summe der Kosten pro Stunde der Hosting-Instance.

Menschliche Bewertung:
Wenn Sie die Feature zur menschenbasierte Bewertungs verwenden, bei der Sie Ihre eigenen Worker mitbringen, werden Ihnen drei Elemente in Rechnung gestellt: 1) die für die Inferenz verwendete SageMaker-Instance, 2) die Instance, die zum Ausführen des SageMaker-Verarbeitungsauftrags verwendet wird, der die menschliche Bewertung hostet, und 3 ) eine Gebühr von 0,21 USD pro abgeschlossener menschlicher Bewertungsaufgabe. Eine menschliche Aufgabe ist definiert als das Vorkommen, dass ein menschlicher Mitarbeiter eine Bewertung einer einzelnen Aufforderung und der zugehörigen Inferenzantworten in der Benutzeroberfläche für die menschliche Bewertung abgibt. Der Preis ist derselbe, unabhängig davon, ob Sie ein oder zwei Modelle in Ihrer Bewertungsaufgabe haben oder Ihre eigene Inferenz mitbringen, und auch derselbe, unabhängig davon, wie viele Bewertungsdimensionen und Bewertungsmethoden Sie einbeziehen. Der Preis pro Aufgabe von 0,21 USD ist für alle AWS-Regionen gleich. Für die Belegschaft fallen keine gesonderten Kosten an, da die Belegschaft von Ihnen gestellt wird.

Von AWS verwaltete Bewertung:
Für eine von AWS verwaltete Expertenbewertung werden die Preise in einem privaten Gespräch und in Zusammenarbeit mit dem AWS-Expertenbewertungsteam an Ihre Bewertungsanforderungen angepasst.

Amazon SageMaker Studio Lab

Sie können ML-Modelle mit Amazon SageMaker Studio Lab kostenlos entwickeln und trainieren. SageMaker Studio Lab bietet Entwicklern, Akademikern und Datenwissenschaftlern eine konfigurationsfreie Umgebung zum Lernen und Experimentieren mit ML, ohne dass zusätzliche Kosten anfallen.

Amazon SageMaker Canvas

Amazon SageMaker Canvas erweitert den ML-Zugriff, indem es Geschäftsanalysten die Möglichkeit bietet, mithilfe einer visuellen Point-and-Click-Oberfläche genaue ML-Vorhersagen zu generieren – ohne Programmier- oder ML-Erfahrung.

Amazon-SageMaker-Datenbeschriftung

Die Amazon-SageMaker-Datenbeschriftung liefert zwei Datenbeschriftungs-Angebote, Amazon SageMaker Ground Truth Plus und Amazon SageMaker Ground Truth. Erfahren Sie mehr über die Amazon-SageMaker-Datenbeschriftung, einen vollständig verwalteten Datenbeschriftungs-Service, mit dem Sie ganz einfach hochpräzise Trainings-Datensätze für ML entwickeln können.

Amazon-SageMaker-Schattentests

Mit SageMaker können Sie Schattentests durchführen, um ein neues ML-Modell vor der Produktionsfreigabe zu evaluieren, indem Sie seine Leistung im Vergleich zum aktuell eingesetzten Modell testen. Für SageMaker-Schattentests fallen außer den Nutzungsgebühren für die ML-Instances und den ML-Speicher, die zum Hosten des Schattenmodells bereitgestellt werden, keine zusätzlichen Gebühren an. Die Preise für ML-Instanzen und ML-Speicherdimensionen sind dieselben wie für die Echtzeit-Inferenzoption, die in der vorangehenden Preistabelle angegeben ist. Es fallen keine zusätzlichen Gebühren für Daten an, die innerhalb und außerhalb von Schattenbereitstellungen verarbeitet werden.

Amazon SageMaker Edge

Erfahren Sie mehr über die Preise von Amazon SageMaker Edge zur Optimierung, Ausführung und Überwachung von ML-Modellen auf Flotten von Geräten am Netzwerkrand. 

Savings Plans für Amazon SageMaker

Mit den Amazon SageMaker Savings Plans können Sie Ihre Kosten um bis zu 64 % senken. Die Pläne gelten automatisch für die Nutzung berechtigter SageMaker-ML-Instances, einschließlich SageMaker-Studio-Notebooks, SageMaker-Notebook-Instances, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference und SageMaker Batch Transform, unabhängig von der Instance-Familie, Größe oder Region. Sie können zum Beispiel jederzeit die Nutzung einer CPU-Instance ml.c5.xlarge, die in USA Ost (Ohio) läuft, auf eine ml.Inf1-Instance in USA West (Oregon) für Inferenz-Workloads ändern und automatisch den Preis des Savings Plans weiter bezahlen. 

Weitere Informationen »

Gesamtbetriebskosten (TCO) mit Amazon SageMaker

Amazon SageMaker bietet mindestens 54 % niedrigere Gesamtbetriebskosten (TCO) über einen Zeitraum von drei Jahren im Vergleich zu anderen selbstverwalteten cloudbasierten Lösungen. Erfahren Sie mehr mit der vollständigen TCO-Analyse für Amazon SageMaker.

Preisbeispiele

  • Als Datenwissenschaftler verbringen Sie 20 Tage damit, JupyterLab für schnelle Experimente mit Notebooks, Code und Daten für 6 Stunden pro Tag auf einer ml.g4dn.xlarge-Instance zu verwenden. Sie erstellen einen JupyterLab-Space und führen ihn dann aus, um auf die JupyterLab-IDE zuzugreifen. Die Rechenleistung wird nur für die Instance berechnet, die verwendet wird, wenn der JupyterLab-Speicherplatz läuft. Die Speichergebühren für einen JupyterLab-Speicherplatz fallen an, bis er gelöscht wird.

    Datenverarbeitung

    Instance Dauer Tage Gesamtdauer Kosten pro Stunde Gesamtsumme
    ml.g4dn.xlarge 6 Stunden 20 6 * 20 = 120 Stunden 0,7364 USD 88,368 USD

    Speicher

    Sie werden den Allzweck-SSD-Speicher 480 Stunden lang (24 Stunden* 20 Tage) verwenden. In einer Region, die 0,1125 USD pro GB-Monat berechnet:
    0,112 USD pro GB-Monat * 5 GB * 480 / (24 Stunden/Tag * 30-Tage-Monat) = 0,373 USD

  • Als ML-Ingenieur verbringen Sie 20 Tage damit, den Code-Editor für die Bearbeitung, Ausführung und das Debuggen von ML-Produktionscode für 6 Stunden pro Tag auf einer ml.g4dn.xlarge-Instance zu verwenden. Sie erstellen einen Code-Editor-Bereich und führen ihn dann aus, um auf die Code-Editor-IDE zuzugreifen. Die Rechenleistung wird nur für die Instance berechnet, die verwendet wird, wenn der Code-Editor-Speicherplatz läuft. Die Speichergebühren für einen Code-Editor fallen an, bis er gelöscht wird.

    Datenverarbeitung

    Instance Dauer Tage Gesamtdauer Kosten pro Stunde Gesamtsumme
    ml.g4dn.xlarge 6 Stunden 20 6 * 20 = 120 Stunden 0,7364 USD 88,368 USD

    Speicher

    Sie werden den Allzweck-SSD-Speicher 480 Stunden lang (24 Stunden* 20 Tage) verwenden. In einer Region, die 0,1125 USD pro GB-Monat berechnet:
    0,112 USD pro GB-Monat * 5 GB * 480 / (24 Stunden/Tag * 30-Tage-Monat) = 0,373 USD

  • Ein Datenwissenschaftler durchläuft bei der Verwendung von Notebooks in Amazon SageMaker Studio Classic die folgende Abfolge von Aktionen:

    1. Öffnet Notebook 1 in einem TensorFlow-Kernel auf einer ml.c5.xlarge-Instance und arbeitet dann 1 Stunde lang auf diesem Notebook.
    2. Öffnet Notebook 2 auf einer ml.c5.xlarge-Instance. Es wird automatisch in der gleichen ml.c5.xlarge-Instance geöffnet, in der auch Notebook 1 ausgeführt wird. 
    3. Arbeitet 1 Stunde lang gleichzeitig an Notebook 1 und an Notebook 2.
    4. Dem Daten-Wissenschaftler werden insgesamt 2 Stunden der Verwendung von ml.c5.xlarge in Rechnung gestellt. Für die überlappende Stunde, in der sie gleichzeitig an Notebook 1 und Notebook 2 gearbeitet hat, wird jede Kernel-Anwendung für 0,5 Stunden gemessen und ihr 1 Stunde in Rechnung gestellt.
    Kernel-Anwendung Notebook-Instance Stunden Kosten pro Stunde Gesamtsumme
    TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD
    TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Datenwissenschaft ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Ein Datenwissenschaftler führt die folgenden Aktionen durch, während sie RStudio verwendet:

    1. Launcht RSession 1 auf einer ml.c5.xlarge-Instance und arbeitet dann 1 Stunde lang an diesem Notebook.
    2. Startet RSession 2 auf einer ml.c5.xlarge Instance. Es wird automatisch in der gleichen ml.c5.xlarge-Instance geöffnet, in der auch RSession 1 ausgeführt wird.
    3. Arbeitet 1 Stunde lang gleichzeitig an RSesssion 1 und RSession 2.
    4. Dem Daten-Wissenschaftler werden insgesamt zwei (2) Stunden der Verwendung von ml.c5.xlarge in Rechnung gestellt. Für die sich überschneidende Stunde, in der sie gleichzeitig an RSession 1 und RSession 2 gearbeitet hat, wird jede RSession-Anwendung mit 0,5 Stunden berechnet und ihr wird 1 Stunde in Rechnung gestellt.

    In der Zwischenzeit läuft der RServer 24/7, egal ob RSessions laufen oder nicht. Wenn der Admin „Small“ (ml.t3.medium) wählt, dann ist es kostenlos. Wählt der Admin "Medium" (ml.c5.4xlarge) oder "Large" (ml.c5.9xlarge), so wird stundenweise abgerechnet, sofern RStudio für die SageMaker-Domäne aktiviert ist.

    RSession-App RSession-Instance Stunden Kosten pro Stunde Gesamtsumme
    Base R ml.c5.xlarge 1 0,204 USD 0,204 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Für die Verarbeitung in Amazon SageMaker fallen nur Gebühren für die genutzte Instance während der Ausführung Ihrer Aufträge an. Wenn Sie die Eingabedaten zur Verarbeitung in Amazon S3 bereitstellen, lädt Amazon SageMaker die Daten zu Beginn der Verarbeitungsaufgabe aus Amazon S3 auf einen lokalen Dateispeicher herunter.

    Der Datenanalyst führt einen Auftrag zur Vorverarbeitung und Validierung von Daten auf zwei ml.m5.4xlarge-Instances für eine Auftragsdauer von 10 Minuten aus. Sie lädt einen Datensatz von 100 GB in S3 als Eingabe für den Verarbeitungsauftrag hoch, und die Ausgabedaten (die ungefähr die gleiche Größe haben) werden wieder in S3 gespeichert.

    Stunden Verarbeitungs-Instances Preis pro Stunde Gesamtsumme
    1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD
    Universell-Speicher (SSD) (GB) Preis pro Stunde Gesamtsumme
    100 GB * 2 = 200 0,14 USD 0,0032 USD

    Die Zwischensumme für den Amazon-SageMaker-Verarbeitungsauftrag = 0,308 USD.
    Zwischensumme für 200 GB an Universell-Speicher (SSD) = 0,0032 USD.
    In diesem Beispiel würden insgesamt 0,3112 USD berechnet werden.

  • Laut Tabelle verwenden Sie Amazon SageMaker Data Wrangler für insgesamt 18 Stunden über 3 Tage, um Ihre Daten aufzubereiten. Zusätzlich legen Sie eine SageMaker Data Wrangler-Aufgabe an, um wöchentlich aktualisierte Daten vorzubereiten. Jede Aufgabe dauert 40 Minuten, und sie wird wöchentlich einen Monat lang ausgeführt.

    Monatliche Gesamtgebühren für die Nutzung von Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

    Anwendung SageMaker-Studio-Instance Tage Dauer Gesamtdauer Kosten pro Stunde Kosten Zwischensumme
    SageMaker Data Wrangler ml.m5.4xlarge 3 6 Stunden 18 Stunden 0,922 USD 16,596 USD
    SageMaker Data Wrangler-Aufgabe ml.m5.4xlarge - 40 Minuten 2,67 Stunden 0,922 USD 2,461 USD

    Als Datenwissenschaftler verbringen Sie drei Tage, 6 Stunden pro Tag, mit Amazon SageMaker Data Wrangler, um Ihre Daten zu bereinigen, zu erforschen und zu visualisieren. Zum Ausführen Ihrer Datenaufbereitungspipeline initiieren Sie dann eine SageMaker Data Wrangler-Aufgabe, die für eine wöchentliche Ausführung geplant ist.

    In der nachstehenden Tabelle sind Ihre Gesamtnutzung für den Monat und die damit verbundenen Gebühren für die Nutzung von Amazon SageMaker Data Wrangler zusammengefasst.

  • ++ Alle gebrochenen Leseeinheiten werden auf die nächste ganze Zahl gerundet

    Datenspeicher
    Insgesamt gespeicherte Daten = 31,5 GB
    Monatliche Kosten für Datenspeicher = 31,5 GB * 0,45 USD = 14,175 USD

    Monatliche Gesamtgebühren für Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

    Tag des Monats Gesamtsumme Schreibvorgänge Gesamtsumme Schreibeinheiten Gesamtsumme Lesevorgänge Gesamtsumme Leseeinheiten
    Tage 1 bis 10 100 000 Schreibvorgänge 
    (10 000 Schreibvorgänge * 10 Tage)
    2 500 000 
    (100 000 * 25KB )
    100 000 
    (10 000 * 10 Tage)
    700 000++ 
    (100 000 * 25/4 KB)
             
    Tag 11 200 000 Schreibvorgänge 5 000 000 
    (200 000 * 25KB )
    200 000 Lesevorgänge 1 400 000++ 
    (200 000 * 25/4KB )
             
    Tage 12 bis 30 1 520 000 Schreibvorgänge 
    (80 000 * 19 Tage)
    38 000 000 
    (1 520 000 * 25 KB)
    1 520 000 Schreibvorgänge
    (80 000 * 19 Tage)
    10 640 000++
    (1 520 000 * 25/4 KB)
             
    Total kostenpflichtige Einheiten   45 500 000 Schreibeinheiten   12 740 000 Leseeinheiten
    Monatliche Gebühren für Schreib- und Lesevorgänge   56.875 USD 
    (45,5 Millionen Schreibeinheiten * 1,25 USD pro Million Schreibvorgänge)
      3,185 USD 
    (12,74 Mio. Leseeinheiten * 0,25 USD pro Mio. Lesevorgänge)

    Sie haben eine Webanwendung, die Lese- und Schreibvorgänge von jeweils 25 KB in den Amazon SageMaker Feature Store ausführt. In den ersten 10 Tagen eines Monats verzeichnet Ihre Anwendung nur wenig Datenverkehr, sodass jeden Tag 10 000 Schreibvorgänge und 10 000 Lesevorgänge im SageMaker Feature Store stattfinden. An Tag 11 des Monats gewinnt Ihre Anwendung Aufmerksamkeit in den sozialen Medien und der Anwendungs-Traffic steigt an diesem Tag auf 200.000 Schreibvorgänge und 200.000 Lesevorgänge. Ihre Anwendung reguliert sich zum Monatsende zu einem gleichmäßigeren Verkehrsaufkommen mit durchschnittlich 80 000 Lese- und 80 000 Schreibvorgängen pro Tag.

    In der nachstehenden Tabelle sind Ihre Gesamtnutzung für den Monat und die damit verbundenen Gebühren für die Nutzung des Amazon SageMaker Feature Store zusammengefasst.

  • Die Gesamtkosten für Training und Debugging betragen in diesem Beispiel 2,38 USD. Für die Computing-Instances und die Universell-Speicher-Volumes, die von den in Amazon SageMaker Debugger integrierten Regeln verwendet werden, fallen keine zusätzlichen Gebühren an.

      Universell-Speicher (SSD) für Training (GB) Universell-Speicher (SSD) für in den Debugger integrierte Regeln (GB) Universell-Speicher (SSD) für benutzerdefinierte Debugger-Regeln (GB) Preis pro GB/Monat Zwischensumme
    Genutzte Kapazität 3 2 1    
    Kosten 0 USD Keine zusätzlichen Gebühren für integrierte Speichervolumes 0 USD 0,10 USD 0 USD

     

    Stunden Training-Instance Debug-Instance Preis pro Stunde Zwischensumme
    4 * 0,5 = 2,00 ml.m4.4xlarge 0,96 USD 1,92 USD
    4 * 0,5 * 2 = 4 Keine zusätzlichen Gebühren für integrierte Regel-Instances 0 USD 0 USD
    4 * 0,5 = 2 ml.m5.xlarge 0,23 USD 0,46 USD
            -------
            2,38 USD

    Ein Datenwissenschaftler hat eine Woche lang an einem Modell für ein neues Konzept gearbeitet. Er trainiert das Modell vier Mal auf einem ml.m4.4xlarge für 30 Minuten pro Trainingslauf, wobei Amazon SageMaker Debugger mit zwei integrierten Regeln einer selbst geschriebenen Regel aktiviert ist. Bei der benutzerdefinierten Regel legte er die ml.m5.xlarge-Instance fest. Sie führt das Training mit einem Trainings-Datenvolumen von 3 GB in Amazon S3 aus und gibt 1 GB an Modellausgabe an Amazon S3 weiter. SageMaker erstellt Universell-Speicher SSD (gp2)-Volumes für jede Trainings-Instance. SageMaker erstellt außerdem Universell-Speicher SSD (gp2)-Volumes für jede definierte Regel. In diesem Beispiel werden insgesamt vier Universell-Speicher SSD (gp2)-Volumes erstellt. SageMaker Debugger gibt 1 GB Debug-Daten an den Amazon-S3-Bucket des Kunden aus.

  • Sie haben zwei Teams von Datenwissenschaftlern. Ein Team mit 10 Datenwissenschaftlern und das andere Team mit 40 Datenwissenschaftlern. Um diesen beiden Teams gerecht zu werden, aktivieren Sie zwei verschiedene MLFlow-Tracking-Server: einen kleinen und einen mittleren. Jedes Team führt Experimente mit Machine Learning (ML) durch und muss die Metriken, Parameter und Artefakte aufzeichnen, die bei den Trainingsversuchen entstehen. Sie möchten die MLFlow-Tracking-Server 160 Stunden pro Monat verwenden. Angenommen, jedes Datenwissenschafts-Team speichert 1 GB an Metadaten, um die Durchläufe von Experimenten zu verfolgen. Die Rechnung am Ende des Monats würde wie folgt berechnet werden:  

    Rechengebühren für Small Instance: 160 * 0,60 USD = 96 USD
    Rechengebühren für Medium Instance: 160 * 1,40 USD = 166,4 USD
    Lagergebühren für zwei Teams: 2 * 1 * 0,10 = 0,20 USD

    Gesamtsumme = 262,60 USD

  • Die Zwischensumme für Training, Hosting und Überwachung beträgt 305,827 USD. Die Zwischensumme für 3 100 MB an verarbeiteten Vorgängen und 310 MB an verarbeiteten Vorgängen für das Hosting pro Monat = 0,054 USD. In diesem Beispiel würden insgesamt 305,881 USD pro Monat berechnet.

    Hinweis: Für integrierte Regeln mit einer ml.m5.xlarge-Instance erhalten Sie bis zu 30 Stunden Überwachung, für alle Endpunkte pro Monat aggregiert, ohne Zusatzkosten.

     

    Eingehende Daten pro Monat – Hosting Ausgehende Daten pro Monat – Hosting Preis pro GB (ein- oder ausgehend) Gesamtsumme
    100 MB * 31 = 3 100 MB   0,016 USD 0,0496 USD
      10 MB * 31 = 310 MB 0,016 USD 0,00496 USD
    Stunden pro Monat Hosting-Instances Modellüberwachungs-Instances Preis pro Stunde Gesamtsumme
    24 * 31 * 2 = 1 488 ml.c5.xlarge   0,204 USD 303,522 USD
    31 * 0,08 = 2,5   ml.m5.4xlarge 0,922 USD 2,305 USD

    Das Modell in Beispiel Nr. 5 wird in zwei (2) ml.c5.xlarge-Instances für ein zuverlässiges Multi-AZ-Hosting zur Produktion bereitgestellt. Die Amazon-SageMaker-Modellüberwachung ist mit einer (1) ml.m5.4xlarge-Instance aktiviert, und die Überwachungsaufträge sind so geplant, dass sie einmal pro Tag ausgeführt werden. Die Ausführung der Überwachungsaufträge dauert fünf Minuten. Das Modell erhält täglich 100 MB an Daten, und die Inferenzen umfassen 1/10 der Eingabedatenmenge.

  • Die Zwischensumme für SageMaker Asynchronous Inference = 15,81 USD + 0,56 USD + 2 * 0,0048 USD = 16,38 USD. Die Gesamtgebühren für Asynchronous Inference betragen in diesem Beispiel 16,38 USD pro Monat.

    Dateneingang pro Monat  Datenausgang pro Monat Kosten pro GB (ein- oder ausgehend) Gesamtsumme
    10 KB * 1,024 * 31 = 310 MB 10 KB * 1,024 * 31 = 310 MB 0,02 USD 0,0048
      10 KB * 1,024 * 31 = 310 MB 0,02 USD 0,0048
    Universell-Speicher (SSD) (GB) Preis pro GB/Monat Gesamtsumme
    4 0,14 USD 0,56 USD
    Stunden pro Monat Hosting-Instances Kosten pro Stunde Gesamtsumme
    2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD

    Amazon SageMaker Asynchronous Inference berechnet Ihnen die von Ihrem Endpunkt verwendeten Instances. Wenn Sie keine aktiven Anforderungen bearbeiten, können Sie, um Kosten zu sparen, die automatische Skalierung so konfigurieren, dass die Anzahl der Instances auf Null reduziert wird. Für Eingabe-Nutzlasten in Amazon S3 fallen keine Kosten für das Lesen von Eingabedaten aus Amazon S3 und das Schreiben der Ausgabedaten in S3 in derselben Region an.

    Das Modell in Beispiel Nr. 5 wird verwendet, um einen Endpunkt von SageMaker Asynchronous Inference auszuführen. Der Endpunkt ist so konfiguriert, dass er auf einer ml.c5.xlarge Instance läuft und die Anzahl der Instances auf Null reduziert, wenn er nicht aktiv Anforderungen verarbeitet. Die Instance ml.c5.xlarge im Endpunkt verfügt über 4 GB an universellem (SSD) Speicher, der ihr angefügt ist. In diesem Beispiel behält der Endpunkt eine Instance-Anzahl von 1 für 2 Stunden pro Tag bei und hat eine Ruhephase von 30 Minuten. Danach wird er für den Rest des Tages auf eine Instance-Anzahl von Null heruntergefahren. Es werden also 2,5 Stunden Nutzung pro Tag berechnet. 

    Der Endpunkt verarbeitet 1,024 Anforderungen pro Tag. Die Größe jedes Aufrufs-Anforderung/Antwort-Paket beträgt 10 KB, und die Nutzlast jeder Inferenz-Anforderung in Amazon S3 beträgt 100 MB. Die Inferenzausgaben sind 1/10 so groß wie die Eingabedaten, die wieder in Amazon S3 in derselben Region gespeichert werden. In diesem Beispiel gelten die Datenverarbeitungs-Gebühren für die Anfrage und die Antwort, nicht aber für die Daten, die zu/von Amazon S3 übertragen werden. 

  • Die Gesamtkosten für Inferenz belaufen sich in diesem Beispiel auf 2,88 USD.

    Stunden Hosting-Instances Kosten pro Stunde Gesamtsumme
    3 * 0,25 * 4 = 3 Stunden ml.m4.4xlarge 0,96 USD 2,88 USD

    Das Modell in Beispiel 5 wird zur Ausführung von SageMaker Batch Transform verwendet. Der Datenwissenschaftler führt vier separate SageMaker-Batch-Transformationsaufgaben auf 3 ml.m4.4xlarge-Instances für jeweils 15 Minuten pro Aufgabenausführung aus. Dabei wird für jede Ausführung in S3 ein Bewertungsdatensatz mit 1 GB hochgeladen. Die Inferenzen haben 1/10 der Größe der in S3 gespeicherten Eingabedaten.

  • Monatliche Datenverarbeitungsgebühren

    Datenverarbeitung (GB) Kosten pro GB (ein- oder ausgehend) Monatliche Datenverarbeitungsgebühr
    10 GB 0,016 USD 0,16 USD

    Die Zwischensumme der Gebühr für die Dauer von SageMaker Serverless Inference = 40 USD. Die Zwischensumme der Datenverarbeitungsgebühr für 10 GB = 0,16 USD. In diesem Beispiel würden insgesamt 40,16 USD berechnet.

    Monatliche Computing-Gebühren

    Anzahl der Anforderungen Dauer jeder Anfrage Gesamtdauer der Inferenz (Sek.) Preis pro Sekunde Monatliche Gebühr für die Inferenzdauer
    10 M 100 ms 1 Mio. 0,00004 USD 40 USD

    Bei On-Demand-Serverless-Inference bezahlen Sie nur für die Rechenkapazität, die für die Verarbeitung von Inferenz-Anforderungen verwendet wird, die nach Millisekunden und verarbeiteter Datenmenge abgerechnet wird. Die Datenverarbeitungsgebühr hängt von der ausgewählten Arbeitsspeicher-Konfiguration ab.

    Wenn Sie Ihrem Endpunkt 2 GB Arbeitsspeicher zuweisen, ihn in einem Monat 10 Millionen Mal ausführen und jedes Mal 100 ms laufen lassen und insgesamt 10 GB an Dateneingängen und -ausgängen verarbeiten, würden Ihre Kosten wie folgt berechnet:

  • Nehmen wir an, Sie betreiben einen Chat-Bot-Service für ein Unternehmen, das Lohn- und Gehaltsabrechnungen abwickelt. Sie erwarten Ende März, also noch vor Ablauf der Frist für die Steuererklärung, einen Anstieg der Kundenanfragen. Für den Rest des Monats wird jedoch mit einem geringen Verkehr gerechnet. Sie stellen also einen serverlosen Endpunkt mit 2 GB Arbeitsspeicher bereit und fügen für die letzten 5 Tage des Monats von 9 bis 17 Uhr (8 Stunden) Provisioned Concurrency von 100 hinzu. In dieser Zeit verarbeitet Ihr Endpunkt 10 Mio. Anfragen und insgesamt 10 GB an ein-/ausgehenden Daten. Den Rest des Monats läuft der Chat-Bot auf On-Demand Serverless Inference und verarbeitet 3 Mio. Anfragen und 3 GB Datenein-/Ausgang. Gehen wir davon aus, dass die Dauer jeder Anfrage 100 ms beträgt.

    Provisioned Concurrency (PC) – Gebühren
    Der PC-Preis beträgt 0,000010 USD pro Sekunde
    PC-Nutzungsdauer (Sekunden) = 5 Tage* 100 PC* 8 Stunden* 3.600 Sekunden = 14.400.000 Sekunden
    PC-Nutzungsgebühr = 14.400.000 Sekunden* 0,000010 USD pro Sekunde = 144 USD.

    Gebühren für die Inferenzdauer für Datenverkehr, der von Provisioned Concurrency bedient wird
    Der Preis für die Inferenzdauer beträgt 0,000023 USD pro Sekunde
    Gesamtdauer der Inferenz für PC (s) = 10 M* (100 ms) /1.000 = 1 M Sekunden.
    Gebühren für die Inferenzdauer für PC = 1.000.000 Sek. * 0,000023 USD pro Sekunde =23 USD

    Gebühren für die Dauer der Inferenz auf Abruf
    Der monatliche Preis für Computing beträgt 0,00004 USD pro Sekunde und im kostenlosen Kontingent stehen 150.000 Sekunden zur Verfügung.
    Gesamtrechenleistung (Sekunden) = (3) M * (100 ms) /1000 = 0,3 Mio. Sekunden.
    Datenverarbeitung gesamt – Datenverarbeitung kostenloses Kontingent = monatliche gebührenpflichtige Datenverarbeitung in Sekunden
    0,3 Mio. Sekunden – 150.000 Sekunden = 150.000 Sekunden
    Monatliche Datenverarbeitungsgebühr = 150.000 * 0,00004 USD = 6 USD

    Datenverarbeitung
    Kosten/GB verarbeiteter Daten eingehend/ausgehend = 0,016 USD
    Insgesamt verarbeitete GB = 10 + 3 = 13
    Gesamtkosten = 0,016 USD*13 = 0,208 USD

    Gesamtkosten für März
    Gesamtkosten = Bereitgestellte Parallelitätsgebühren + Inferenzdauer für bereitgestellte Parallelität + Inferenzdauer für On-Demand-Computing + Datenverarbeitungsgebühren
    = 144 USD +23 USD + 6 USD + 0,208 USD = 173,20 USD

  • Der Kunde nutzt JumpStart, um ein vorab trainiertes BERT-Base-Uncased-Modell bereitzustellen, um die Stimmung der Kundenrezensionen als positiv oder negativ zu einzustufen.

    Der Kunde setzt das Modell auf zwei (2) ml.c5.xlarge-Instances für zuverlässiges Multi-AZ-Hosting ein. Das Modell erhält täglich 100 MB an Daten, und die Inferenzen umfassen 1/10 der Eingabedatenmenge.

    Stunden pro Monat Hosting-Instances Kosten pro Stunde Gesamtsumme
    24 * 31 * 2 = 1 488 ml.c5.xlarge 0,204 USD 303,55 USD
     
    Eingehende Daten pro Monat – Hosting Ausgehende Daten pro Monat – Hosting Kosten pro GB (ein- oder ausgehend)

    Gesamtsumme

    100 MB * 31 = 3 100 MB   0,02 USD 0,06 USD
      10 MB * 31 = 310 MB 0,02 USD 0,01 USD
     

    Die Zwischensumme für Training, Hosting und Überwachung beträgt 305,827 USD. Die Zwischensumme für 3 100 MB an verarbeiteten eingehenden Daten und 310 MB an verarbeiteten ausgehenden Daten für Hosting pro Monat = 0,06 USD. In diesem Beispiel würden insgesamt 305,887 USD pro Monat berechnet.

  • Nehmen wir an, Sie möchten einen Cluster von 4 ml.g5.24xlarge für einen Monat (30 Tage) mit zusätzlichen 100 GB Speicher pro Instance bereitstellen, um die Modellentwicklung zu unterstützen. Die Gesamtkosten für den Cluster und zusätzlichen Speicher betragen in diesem Beispiel 29.374,40 USD.

    Computing

    Instance Dauer Instances Kosten pro Stunde Zwischensumme
    ml.g5.24xlarge 30 Tage* 24 Stunden = 720 Stunden 4 10,18 USD 29.318,40 USD

    Speicher

    Standardspeicher (SSD) Dauer Instances Preis pro GB/Monat Zwischensumme
    100 GB 30 Tage* 24 Stunden = 720 Stunden 4 0,14 USD 56,00 USD
  • Bewertungen von Grundlagenmodellen mit SageMaker Clarify berechnen Ihnen nur die Instances, die während der Ausführung Ihrer automatischen Bewertungsaufträge verwendet werden. Wenn Sie eine automatische Bewertungsaufgabe und einen Datensatz auswählen, lädt SageMaker den Eingabeaufforderungsdatensatz von Amazon S3 auf eine SageMaker-Bewertungs-Instance.

    Im folgenden Beispiel führt ein ML-Techniker eine Bewertung des Llama2-7B-Modells in USA-Ost (Nord-Virginia) durch, um die Genauigkeit der Zusammenfassungsaufgabe zu ermitteln. Der empfohlene Instance-Typ für Inferenz für Llama 2 7B lautet ml.g5.2xlarge. Die empfohlene Mindest-Instance für eine Bewertung lautet ml.m5.2xlarge. In diesem Beispiel wird der Auftrag 45 Minuten lang ausgeführt (abhängig von der Größe des Datensatzes). In diesem Beispiel würden die Kosten für den Bewertungsauftrag und die detaillierten Ergebnisse 1,48 USD betragen.

    Bearbeitung von Arbeitsstunden (Beispiel)

    Region

    Instance-Typ

    Instance

    Kosten pro Stunde

    Kosten

    0,45

    US-east-1

    LLM-Hosting

    ml.g5.2xlarge

    1,52 USD

    1,14 USD

    0,45

    US-east-1

    Auswertung

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Gesamtsumme

           

    1,48 USD

    Im nächsten Beispiel führt derselbe Techniker in Virginia einen weiteren Bewertungsauftrag für die Genauigkeit der Zusammenfassungsaufgabe aus, verwendet jedoch eine angepasste Version von Llama 2 7B, die für seinem Konto bereitgestellt und ausgeführt wird. Da das Modell in diesem Fall bereits auf ihrem Konto bereitgestellt ist, fallen die einzigen zusätzlichen Kosten für die Bewertungs-Instance an.

    Bearbeitung von Arbeitsstunden

    Region

    Instance-Typ

    Instance

    Kosten pro Stunde

    Kosten

    0,45

    US-east-1

    Auswertung

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Gesamtsumme

           

    0,35 USD

  • Im folgenden Beispiel führt ein Techniker für Machine Learning in USA Ost (N. Virginia) eine menschenbasierte Bewertung von Llama-2-7B für die Genauigkeit der Zusammenfassungsaufgabe aus und verwendet für die Bewertung seine eigenen privaten Worker. Der empfohlene Instance-Typ für Llama-2-7B lautet ml.g5.2xlarge. Die empfohlene Mindest-Instance für einen von Menschen bewerteten Verarbeitungsauftrag lautet ml.t3.medium. Die Inferenz auf Llama-2-7B dauert 45 Minuten (abhängig von der Größe des Datensatzes). Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 2 Worker, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Worker pro Eingabeaufforderung“). Dieser Bewertungsauftrag umfasst 100 Aufgaben (1 Aufgabe für jedes Eingabeaufforderungs-/Antwortpaar pro Worker: 2 Worker x 50 Eingabeaufforderungs-/Antwortsätze = 100 menschliche Aufgaben). Die menschliche Belegschaft benötigt einen Tag (24 Stunden), um alle 100 menschlichen Bewertungsaufgaben des Bewertungsauftrags zu erledigen (abhängig von der Anzahl und dem Kompetenzniveau der Worker und der Länge/Komplexität der Eingabeaufforderungen und Inferenzantworten).

    Stunden berechnen

    Menschliche Aufgaben

    Region

    Instance-Typ

    Instance

    Kosten pro Stunde

    Kosten pro menschlicher Aufgabe

    Gesamtkosten

    0,45

     

    USA Ost (Nord-Virginia)

    LLM-Hosting

    ml.g5.2xlarge

    1,52 USD

     

    1,14 USD

    24

     

    USA Ost (Nord-Virginia)

    Auftrag wird verarbeitet

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Beliebig

         

    0,21 USD

    21,00 USD

    Gesamtsumme

               

    23,34 USD

    Im nächsten Beispiel führt derselbe Techniker in USA Ost (Nord-Virginia) denselben Bewertungsauftrag aus, verwendet jedoch Llama-2-7B, das bereits in seinem Konto bereitgestellt und betriebsbereit ist. In diesem Fall würden die einzigen zusätzlichen Kosten für die Bewertungsverarbeitung und menschliche Aufgaben anfallen.

    Stunden berechnen

    Menschliche Aufgaben

    Region

    Instance-Typ

    Instance

    Kosten pro Stunde

    Kosten pro menschlicher Aufgabe

    Gesamtkosten

    24

     

    USA Ost (Nord-Virginia)

    Auftrag wird verarbeitet

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Beliebig

         

    0,21 USD

    21,00 USD

    Gesamtsumme

               

    22,20 USD