Machine-Learning-Service – Amazon-SageMaker-Preise

Amazon SageMaker unterstützt Datenwissenschaftler und Entwickler bei der Vorbereitung, der Erstellung, dem Training und der Bereitstellung hochwertiger Machine Learning (ML)-Modelle durch eine breite Palette von speziell für ML entwickelten Funktionen. SageMaker unterstützt die führenden ML-Frameworks, Toolkits und Programmiersprachen.

Mit SageMaker zahlen Sie nur für das, was Sie tatsächlich nutzen. Sie haben zwei Zahlungsmöglichkeiten: ein On-Demand-Preismodell, das keine Mindestgebühren und keine Vorausleistungen vorsieht, und die SageMaker-Savings-Plans, die ein flexibles, nutzungsbasiertes Preismodell im Austausch für die Verpflichtung zu einer kontinuierlichen Nutzungsmenge bieten.

Kostenloses Kontingent von Amazon SageMaker

Amazon SageMaker kostenlos testen. Im Rahmen des kostenlosen Kontingents für AWS können Sie Amazon SageMaker zum Einstieg kostenlos verwenden. Ihr kostenloses Kontingent startet mit dem ersten Monat, nachdem Sie Ihre erste SageMaker-Ressource erstellt haben. Die Details zum kostenlosen Kontingent für Amazon SageMaker sind in der Tabelle unten aufgeführt.

Fähigkeiten von Amazon SageMaker	Nutzung eines kostenlosen Kontingents pro Monat für die ersten 2 Monate
Studio-Notebooks, und Notebook-Instances	250 Stunden ml.t3.-medium-Instance auf Studio-Notebooks ODER 250 Stunden ml.t2.-medium-Instance oder ml.t3.-medium-Instance auf Notebook-Instances
RStudio auf SageMaker	250 Stunden ml.t3.medium-Instance für die RSession-App UND kostenlose ml.t3.medium-Instance für die RStudioServerPro-App
Data Wrangler	25 Stunden der ml.m5.4xlarge-Instance
Feature Store	10 Millionen Schreibeinheiten, 10 Millionen Leseeinheiten, 25 GB Speicher (Standard-Online-Speicher)
Training	50 Stunden m4.xlarge- oder m5.xlarge-Instances
Amazon SageMaker mit TensorBoard	300 Stunden ml.r5.large-Instance
Echtzeit-Inferenz	125 Stunden m4.xlarge- oder m5.xlarge-Instances
Serverless-Inferenz	150 000 Sekunden Dauer der On-Demand-Inferenz
Canvas	160 Stunden/Monat für Sitzungszeit
HyperPod	50-Stunden-m5.xlarge-Instance
	Nutzung des kostenlosen Kontingents pro Monat für die ersten 6 Monate
Experimente	100 000 erfasste Metrikdatensätze pro Monat, 1 Million abgerufene Metrikdatensätze pro Monat und 100 000 gespeicherte Metrikdatensätze pro Monat

AWS-Preisrechner

Berechnen Sie Ihre Amazon SageMaker- und Architekturkosten mit einem einzigen Kostenvoranschlag.

Erstellen Sie jetzt Ihren maßgeschneiderte Kostenvoranschlag »

On-Demand-Preise

Studio Classic
Amazon SageMaker Studio Classic
Studio Classic bietet Jupyter-Notebooks in einem Schritt in unserer alten IDE-Erfahrung. Die grundlegenden Rechenressourcen sind vollständig elastisch und die Notebooks können problemlos mit anderen geteilt werden, was eine nahtlose Zusammenarbeit ermöglicht. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.
JupyterLab
Amazon SageMaker JupyterLab
Starten Sie das vollständig verwaltete JupyterLab in Sekundenschnelle. Verwenden Sie die neueste webbasierte interaktive Entwicklungsumgebung für Notebooks, Code und Daten. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.
Code-Editor
Amazon-SageMaker-Code-Editor
Der auf Code-OSS (Visual Studio Code – Open Source) basierende Code-Editor ermöglicht es Ihnen, Ihren Analyse- und ML-Code zu schreiben, zu testen, zu debuggen und auszuführen. Es ist vollständig in SageMaker Studio integriert und unterstützt IDE-Erweiterungen, die in der Open VSX-Erweiterungsregistrierung verfügbar sind.
RStudio
RStudio
RStudio bietet On-Demand-Cloud-Computing-Ressourcen, um die Modellentwicklung zu beschleunigen und die Produktivität zu verbessern. Ihnen werden die Instance-Typen in Rechnung gestellt, die Sie zum Ausführen der RStudio Session-App und der RStudio-Server-Pro-App auswählen.

RStudioServerPro App
Notebook Instances
Notebook-Instances
Notebook-Instances sind Instances für Datenverarbeitung, auf denen die Jupyter-Notebook-App ausgeführt wird. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.
Verarbeitung
Amazon SageMaker Processing
Mit Amazon SageMaker Processing können Sie Ihre Workloads für Vor- und Nachverarbeitung sowie Modellauswertung problemlos in einer vollständig verwalteten Infrastruktur ausführen. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.
TensorBoard
Amazon SageMaker mit TensorBoard
Amazon SageMaker mit TensorBoard bietet ein gehostetes TensorBoard-Erlebnis zur Visualisierung und Behebung von Modellkonvergenzproblemen für Amazon SageMaker-Schulungsaufträge.
Data Wrangler
Amazon SageMaker Data Wrangler

Amazon SageMaker Data Wrangler reduziert den Zeitaufwand für die Aggregation und Aufbereitung von Daten für Machine Learning von Wochen auf Minuten. Sie zahlen für die Zeit, die für das Bereinigen, Durchsuchen und Visualisieren von Daten verwendet wird. Kunden, die SageMaker-Data-Wrangler-Instances ausführen, unterliegen den unten angegebenen Preisen.* Kunden, die SageMaker Data Wrangler auf SageMaker-Canvas-Workspace-Instances ausführen, unterliegen den SageMaker-Canvas-Preisen. Weitere Informationen finden Sie auf der Preisseite von SageMaker Canvas.

Amazon SageMaker Data Wrangler – Aufgaben

Eine Amazon SageMaker Data Wrangler-Aufgabe wird beim exportieren eines Datenstroms aus SageMaker Data Wrangler erstellt. Mit SageMaker Data Wrangler-Aufgaben können Sie Ihre Workflows zur Datenaufbereitung automatisieren. SageMaker Data Wrangler-Aufgaben helfen Ihnen, Ihre Datenaufbereitungs-Workflows zeitsparend auf neue Datensätze anzuwenden, und werden sekundengenau abgerechnet.
Feature Store
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store ist ein zentrales Repository zum Einlesen, Speichern und Bereitstellen von Features für Machine Learning. Schreib- und Lesezugriffe auf Feature-Gruppen und Datenspeicher im SageMaker Feature Store werden Ihnen in Rechnung gestellt, wobei sich die Preise für den Standard-Online-Speicher und den In-Memory-Online-Speicher unterscheiden.

Für den Standard-Online-Speicher wird der Datenspeicher pro GB pro Monat berechnet. Für den Durchsatz können Sie zwischen dem bedarfsgesteuerten oder dem bereitgestellten Kapazitätsmodus wählen. Bei On-Demand werden Schreibvorgänge als Schreibanforderungseinheiten pro KB und Lesevorgänge als Leseanforderungseinheiten pro 4 KB berechnet. Im Modus der bereitgestellten Kapazität geben Sie die Lese- und Schreibkapazität an, die Ihre Anwendung voraussichtlich benötigt. Sagemaker Feature Store berechnet eine WCU für jedes Schreiben pro Sekunde (bis zu 1 KB) und eine RCU für jedes Lesen pro Sekunde (bis zu 4 KB). Ihnen wird die Durchsatzkapazität (Lese- und Schreibvorgänge) berechnet, die Sie für Ihre Feature-Gruppe bereitstellen, auch wenn Sie die bereitgestellte Kapazität nicht vollständig nutzen.

Für den speicherinternen Online-Speicher werden Schreibvorgänge als Schreibanforderungseinheiten pro KB mit einem Minimum von 1 Einheit pro Schreibvorgang berechnet, Lesevorgänge werden als Leseanforderungseinheiten pro KB mit einem Minimum von 1 Einheit pro Lesevorgang berechnet, und die Datenspeicherung wird pro GB pro Stunde berechnet. Für den speicherinternen Online-Speicher wird eine Mindestgebühr von 5 GiB (5,37 GB) pro Stunde erhoben.
Training
Amazon SageMaker – Training
Amazon SageMaker bietet alles, was Sie zum Trainieren, Optimieren und Debuggen von Modellen benötigen, und erleichtert so das Training von ML-Modellen (Machine Learning). Die Nutzung des von Ihnen gewählten Instance-Typs wird Ihnen in Rechnung gestellt. Wenn Sie Amazon SageMaker Debugger zum Debuggen von Problemen und Überwachen von Ressourcen während des Trainings verwenden, können Sie zum Debuggen Ihrer Trainingsaufgaben integrierte Regeln verwenden oder Ihre eigenen benutzerdefinierten Regeln schreiben. Die Verwendung der integrierten Regeln zum Debuggen Ihrer Trainingsaufgaben ist kostenlos. Bei benutzerdefinierten Regeln wird Ihnen der von Ihnen gewählte Instance-Typ auf der Grundlage der Nutzungsdauer in Rechnung gestellt.
Experimente

Amazon SageMaker Experiments
Mit Amazon SageMaker-Experiments können Sie Ihre ML-Experimente organisieren, überwachen und vergleichen. Ihnen wird nur das Erfassen, Abrufen und Speichern in Rechnung gestellt. Ein Metrikdatensatz ist ein Schlüssel/Wert-Paar von Metrikdaten. Aufnahme und Abruf werden basierend auf der Anzahl der Metrikdatensätze berechnet. Die Speicherung wird basierend auf der Anzahl der pro Monat gespeicherten Metrikdatensätze berechnet. Sie können SageMaker Studio zur Visualisierung Ihrer Experimente ohne zusätzliche Kosten verwenden.

Abrechnungsart	Preis
Aufnahme	1,25 USD pro Million Metrikdatensätze
Abruf	0,25 USD pro Million Metrikdatensätze
Speicherung	0,25 USD pro Million Metrikdatensätze – Monat

Echtzeit-Inferenz
Amazon SageMaker Hosting: Echtzeit-Inferenz
Amazon SageMaker bietet Echtzeit-Inferenz für Ihre Anwendungsfälle, die Echtzeit-Vorhersagen benötigen. Die Nutzung des von Ihnen gewählten Instance-Typs wird Ihnen in Rechnung gestellt. Wenn Sie Amazon SageMaker Model Monitor zur Pflege hochpräziser Modelle verwenden, die Echtzeit-Inferenz bereitstellen, können Sie integrierte Regeln zur Überwachung Ihrer Modelle verwenden oder Ihre eigenen Regeln schreiben. Bei integrierten Regeln erhalten Sie bis zu 30 Stunden Überwachung kostenlos. Zusätzliche Gebühren werden nach der Dauer der Nutzung berechnet. Die Verwendung eigener benutzerdefinierter Regeln wird Ihnen separat in Rechnung gestellt.
Asynchrone Inferenz
Amazon SageMaker Asynchrone Inferenz:
Amazon SageMaker Asynchronous Inference ist eine echtzeitnahe Inferenzoption, die eingehende Anforderungen in eine Warteschlange stellt und sie asynchron verarbeitet. Verwenden Sie diese Option, wenn Sie große Nutzdaten verarbeiten müssen, sobald die Daten eintreffen, oder wenn Sie Modelle ausführen, die lange Inferenzverarbeitungszeiten haben und keine Latenzzeiten von unter einer Sekunde benötigen. Die Kosten für die von Ihnen gewählte Instance werden Ihnen in Rechnung gestellt.
Batch Transform
Amazon SageMaker Batch Transform
Mit Amazon SageMaker Batch Transform ist es nicht erforderlich, den Datensatz in einzelne Blöcke zu unterteilen oder Echtzeitendpunkte zu verwalten. Mit SageMaker Batch Transform können Sie Vorhersagen anhand großer oder kleiner Batch-Datensätze ausführen. Der von Ihnen gewählte Instance-Typ wird Ihnen nach der Dauer der Nutzung in Rechnung gestellt.
Serverless Inference
Amazon SageMaker Serverless Inference
Mit Amazon SageMaker Serverless Inference können Sie Machine-Learning-Modelle für Inferenz bereitstellen, ohne die zugrunde liegende Infrastruktur konfigurieren oder verwalten zu müssen. Sie können entweder Serverless Inference auf Abruf verwenden oder Ihrem Endpunkt Provisioned Concurrency hinzufügen, um eine vorhersehbare Leistung zu erzielen.

Bei On-Demand-Serverless-Inference bezahlen Sie nur für die Rechenkapazität, die für die Verarbeitung von Inferenz-Anforderungen verwendet wird, die nach Millisekunden und verarbeiteter Datenmenge abgerechnet wird. Die Computing-Gebühr hängt von der ausgewählten Arbeitsspeicher-Konfiguration ab.

Provisioned Concurrency

Optional können Sie Provisioned Concurrency auch für Ihre Serverless-Endpunkte aktivieren. Provisioned Concurrency (bereitgestellte Nebenläufigkeit) ermöglicht Ihnen die Bereitstellung von Modellen auf Serverless-Endpunkten mit vorhersehbarer Leistung und hoher Skalierbarkeit, indem Ihre Endpunkte für eine bestimmte Anzahl gleichzeitiger Anforderungen warm gehalten werden. Wie bei On-Demand-Serverless-Inferenz zahlen Sie, wenn Provisioned Concurrency aktiviert ist, für die zur Verarbeitung von Inferenzanfragen aufgewendete Rechenkapazität, die pro Millisekunde abgerechnet wird, und für die Menge der verarbeiteten Daten. Sie zahlen auch für die Nutzung von Provisioned Concurrency, basierend auf dem konfigurierten Speicher, der bereitgestellten Dauer und dem Umfang der aktivierten Nebenläufigkeit.
JumpStart
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart hilft Ihnen beim schnellen und einfachen Einstieg in das Machine Learning, indem Sie mit einem Klick auf beliebte Modellsammlungen (auch bekannt als „Modell-Zoos“) zugreifen können. JumpStart bietet auch End-to-End-Lösungen für gängige ML-Anwendungsfälle, die an Ihre Bedürfnisse angepasst werden können. Für die Nutzung von JumpStart-Modellen oder -Lösungen fallen keine zusätzlichen Gebühren an. Die Stunden für die zugrunde liegende Instance Training und Inference werden Ihnen genauso in Rechnung gestellt, wie wenn Sie sie manuell erstellt hätten.
Profiler
Amazon SageMaker Profiler erfasst Daten auf Systemebene zur Visualisierung von hochauflösenden CPU- und GPU-Trace-Plots. Dieses Tool wurde entwickelt, um Datenwissenschaftlern und Ingenieuren dabei zu helfen, hardwarebedingte Leistungsengpässe in ihren Deep-Learning-Modellen zu identifizieren und so Zeit und Kosten für umfassende Schulungen zu sparen. Derzeit unterstützt SageMaker Profiler nur die Profilerstellung von Trainingsaufträgen unter Nutzung der Trainings-Datenverarbeitungs-Instance-Typen ml.g4dn.12xlarge, ml.p3dn.24xlarge und ml.p4d.24xlarge.

Regionen: USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon), Europa (Frankfurt), Europa (Irland) und Israel (Tel Aviv).

Amazon SageMaker Profiler befindet sich derzeit in der Vorschauversion und ist nur für Kunden in unterstützten Regionen kostenlos verfügbar.
HyperPod
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod wurde speziell entwickelt, um die Entwicklung von Foundation Models (FMs) zu beschleunigen. Um das FM-Training widerstandsfähiger zu machen, überwacht es kontinuierlich den Zustand des Clusters, repariert und ersetzt fehlerhafte Knoten im laufenden Betrieb und speichert häufige Checkpoints, um das Training automatisch fortzusetzen, ohne dass der Fortschritt verloren geht. SageMaker HyperPod ist mit verteilten SageMaker-Trainingsbibliotheken vorkonfiguriert, mit denen Sie die FM-Trainingsleistung verbessern und gleichzeitig die Computer- und Netzwerkinfrastruktur des Clusters voll ausnutzen können.

Instance-Details

Produktdetails zur Amazon-SageMaker-P5-Instance

Instance-Größe	vCPUs	Instance-Arbeitsspeicher (TiB)	GPU-Modell	GPU	GPU-Speicher insgesamt (GB)	Speicher pro GPU (GB)	Netzwerkbandbreite (Gbit/s)	GPUDirect RDMA	GPU Peer-to-Peer	Instance-Speicher (TB)	EBS-Bandbreite (Gbit/s)
ml.p5.48xlarge	192	2	NVIDIA H100	8	640 HBM3	80	3200 EFAv2	Ja	900 GB/s NVSwitch	8x3.84 NVMe-SSD	80

Produktdetails zur Amazon-SageMaker-P4d-Instance

Instance-Größe	vCPUs	Instance-Arbeitsspeicher (GiB)	GPU-Modell	GPUs	GPU-Speicher insgesamt (GB)	Speicher pro GPU (GB)	Netzwerkbandbreite (Gbit/s)	GPUDirect RDMA	GPU-Peer-to-Peer	Instance-Speicher (GB)	EBS-Bandbreite (GBit/s)
ml.p4d.24xlarge	96	1152	NVIDIA A100	8	320 HBM 2	40	400 ENA und EFA	Ja	600 GB/s NVSwitch	8 x 1 000 NVMe SSD	19
ml.p4de.24xlarge	96	1152	NVIDIA A100	8	640 HNM2e	80	400 ENA und EFA	Ja	600 GB/s NVSwitch	8X1000 NVMe-SSD	19

Amazon-SageMaker-P3-Instance – Produktdetails

Instance-Größe	vCPUs	Instance-Arbeitsspeicher (GiB)	GPU-Modell	GPUs	GPU-Speicher insgesamt (GB)	Speicher pro GPU (GB)	Netzwerkbandbreite (Gbit/s)	GPU Peer-to-Peer	Instance-Speicher (GB)	EBS-Bandbreite (Gbit/s)
ml.p3.2xlarge	8	61	NVIDIA V100	1	16	16	Bis zu 10	n. a.	Nur EBS	1,5
ml.p3.8xlarge	32	244	NVIDIA V100	4	64	16	10	NVLink	Nur EBS	7
ml.p3.16xlarge	64	488	NVIDIA V100	8	128	16	25	NVLink	Nur EBS	14
ml.p3dn.24xlarge	96	768	NVIDIA V100	8	256	32	100	NVLink	2 x 900 NVMe-SSD	19

Produktdetails zur Amazon-SageMaker-P2-Instance

Instance-Größe	vCPUs	Instance-Arbeitsspeicher (GiB)	GPU-Modell	GPUs	GPU-Speicher insgesamt (GB)	Speicher pro GPU (GB)	Netzwerkbandbreite (Gbit/s)	EBS-Bandbreite (Gbit/s)
ml.p2.xlarge	4	61	NVIDIA K80	1	12	12	Bis zu 10	Hoch
ml.p2.8xlarge	32	488	NVIDIA K80	8	96	12	10	10
ml.p2.16xlarge	64	732	NVIDIA K80	16	192	12	25	20

Produktdetails zur Amazon-SageMaker-G4-Instance

Instance-Größe	vCPUs	Instance-Arbeitsspeicher (GiB)	GPU-Modell	GPUs	GPU-Speicher insgesamt (GB)	Speicher pro GPU (GB)	Netzwerkbandbreite (Gbit/s)	Instance-Speicher (GB)	EBS-Bandbreite (GBit/s)
ml.g4dn.xlarge	4	16	NVIDIA T4	1	16	16	Bis zu 25	1 x 125 NVMe-SSD	Bis zu 3,5
ml.g4dn.2xlarge	8	32	NVIDIA T4	1	16	16	Bis zu 25	1 x 125 NVMe-SSD	Bis zu 3,5
ml.g4dn.4xlarge	16	64	NVIDIA T4	1	16	16	Bis zu 25	1 x 125 NVMe-SSD	4,75
ml.g4dn.8xlarge	32	128	NVIDIA T4	1	16	16	50	1 x 900 NVMe SSD	9,5
ml.g4dn.16xlarge	64	256	NVIDIA T4	1	16	16	50	1 x 900 NVMe SSD	9,5
ml.g4dn.12xlarge	48	192	NVIDIA T4	4	64	16	50	1 x 900 NVMe SSD	9,5

Amazon-SageMaker-G5-Instance – Produktdetails

Instance-Größe	vCPUs	Instance-Arbeitsspeicher (GiB)	GPU-Modell	GPUs	GPU-Speicher insgesamt (GB)	Speicher pro GPU (GB)	Netzwerkbandbreite (Gbit/s)	EBS-Bandbreite (GBit/s)	Instance-Speicher (GB)
ml.g5n.xlarge	4	16	NVIDIA A10G	1	24	24	Bis zu 10	Bis zu 3,5	1 x 250
ml.g5.2xlarge	8	32	NVIDIA A10G	1	24	24	Bis zu 10	Bis zu 3,5	1 x 450
ml.g5.4xlarge	16	64	NVIDIA A10G	1	24	24	Bis zu 25	8	1 x 600
ml.g5.8xlarge	32	128	NVIDIA A10G	1	24	24	25	16	1 x 900
ml.g5.16xlarge	64	256	NVIDIA A10G	1	24	24	25	16	1 x 1900
ml.g5.12xlarge	48	192	NVIDIA A10G	4	96	24	40	16	1 x 3 800
ml.g5.24xlarge	96	384	NVIDIA A10G	4	96	24	50	19	1 x 3 800
ml.g5.48xlarge	192	768	NVIDIA A10G	8	192	24	100	19	2 x 3 800

Produktdetails zur Amazon-SageMaker-Trn1-Instance

Instance-Größe	vCPUs	Arbeitsspeicher (GiB)	Trainium-Beschleuniger	Beschleunigerspeicher gesamt (GB)	Arbeitsspeicher pro Beschleuniger (GB)	Instance-Speicher (GB)	Netzwerkbandbreite (Gbit)	EBS-Bandbreite (Gbit/s)
ml.trn1.2xlarge	8	32	1	32	32	1 x 500 NVMe SSD	Bis zu 12,5	Bis zu 20
ml.trn1.32xlarge	128	512	16	512	32	4 x 2 000 NVMe-SSD	800	80

Produktdetails zur Amazon-SageMaker-Inf1-Instance

Instance-Größe	vCPUs	Arbeitsspeicher (GiB)	Inferentia-Beschleuniger	Beschleunigerspeicher gesamt (GB)	Arbeitsspeicher pro Beschleuniger (GB)	Instance-Speicher	Inter-Beschleuniger-Verbindungen	Netzwerkbandbreite (Gbit/s)	EBS-Bandbreite (Gbit/s)
ml.inf1.xlarge	4	8	1	8	8	Nur EBS	n.a.	Bis zu 25	Bis zu 4,75
ml.inf1.2xlarge	8	16	1	8	8	Nur EBS	n.a.	Bis zu 25	Bis zu 4,75
ml.inf1.6xlarge	24	48	4	32	8	Nur EBS	Ja	25	4,75
ml.inf1.24xlarge	96	192	16	128	8	Nur EBS	ja	100	19

Produktdetails zur Amazon-SageMaker-Inf2-Instance

Instance-Größe	vCPUs	Arbeitsspeicher (GiB)	Inferentia-Beschleuniger	Beschleunigerspeicher gesamt (GB)	Arbeitsspeicher pro Beschleuniger (GB)	Instance-Speicher	Inter-Beschleuniger-Verbindungen	Netzwerkbandbreite (Gbit/s)	EBS-Bandbreite (Gbit/s)
ml.inf2.xlarge	4	16	1	32	32	Nur EBS	n.a.	Bis zu 25	Bis zu 10
ml.inf2.8xlarge	32	128	1	32	32	Nur EBS	n.a.	Bis zu 25	10
ml.inf2.24xlarge	96	384	6	196	32	Nur EBS	Ja	50	30
ml.inf2.48xlarge	192	768	12	384	32	Nur EBS	Ja	100	60

Amazon SageMaker Studio

Amazon SageMaker Studio ist eine einzige webbasierte Oberfläche für die komplette ML-Entwicklung und bietet eine Auswahl an vollständig verwalteten integrierten Entwicklungsumgebungen (IDEs) und speziell entwickelten Tools. Sie können kostenlos auf SageMaker Studio zugreifen. Ihnen werden nur die zugrundeliegende Rechenleistung und der Speicher berechnet, die Sie für verschiedene IDEs und ML-Tools in SageMaker Studio verwenden.

Sie können viele Dienste von SageMaker Studio, AWS SDK für Python (Boto3) oder AWS Command Line Interface (AWS CLI) nutzen, darunter die folgenden:

IDEs auf SageMaker Studio zur Durchführung einer vollständigen ML-Entwicklung mit einer Vielzahl vollständig verwalteter IDEs, darunter JupyterLab, Code-OSS (Visual Studio Code – Open Source) und RStudio
SageMaker Pipelines zum Automatisieren und Verwalten von ML-Workflows
SageMaker Autopilot zum automatischen Erstellen von ML-Modellen mit voller Transparenz
SageMaker Experiments zum Organisieren und Verfolgen Ihrer Aufträge und Versionen
SageMaker Debugger zum Debuggen von Anomalien während des Trainings
SageMaker Model Monitor zur Aufrechterhaltung qualitativ hochwertiger Modelle
SageMaker Clarify zur besseren Erklärung Ihrer ML-Modelle und Verzerrungen zu erkennen
SageMaker JumpStart zur einfachen Bereitstellung von ML-Lösungen für viele Anwendungsfälle. Für die grundlegenden API-Aufrufe, die Amazon SageMaker in Ihrem Namen vornimmt, können Ihnen Gebühren von anderen in der Lösung verwendeten AWS-Services entstehen.
SageMaker Inference Recommender für Empfehlungen zur richtigen Endpunktkonfiguration

Sie zahlen nur für die grundlegenden Computing- und Speicher-Ressourcen in SageMaker oder anderen AWS-Services, je nach Ihrer Nutzung.

Bewertungen des Basismodells

SageMaker Clarify unterstützt Bewertungen von Grundlagenmodellen sowohl mit automatischen als auch mit menschenbasierten Bewertungsmethoden. Jede von ihnen hat unterschiedliche Preise. Wenn Sie ein Grundlagenmodell von Amazon SageMaker JumpStart bewerten, das noch nicht in Ihrem Konto bereitgestellt ist, stellt SageMaker das JumpStart-Modell für die Dauer der Inferenz vorübergehend in einer SageMaker-Instance bereit. Die spezifische Instance entspricht der von JumpStart für dieses Modell bereitgestellten Instance-Empfehlung.

Automatische Bewertung:
Die Auswertungen von Grundlagenmodellen werden als SageMaker-Verarbeitungsauftrag ausgeführt. Der Bewertungsauftrag ruft SageMaker Inference auf. Den Kunden werden die Inferenz und der Bewertungsauftrag in Rechnung gestellt. Kunden werden nur für die Dauer des Bewertungsauftrags in Rechnung gestellt. Die Kosten des Bewertungsauftrags wären die Summe der Kosten pro Stunde der Bewertungs-Instance und der Summe der Kosten pro Stunde der Hosting-Instance.

Menschliche Bewertung:
Wenn Sie die Feature zur menschenbasierte Bewertungs verwenden, bei der Sie Ihre eigenen Worker mitbringen, werden Ihnen drei Elemente in Rechnung gestellt: 1) die für die Inferenz verwendete SageMaker-Instance, 2) die Instance, die zum Ausführen des SageMaker-Verarbeitungsauftrags verwendet wird, der die menschliche Bewertung hostet, und 3 ) eine Gebühr von 0,21 USD pro abgeschlossener menschlicher Bewertungsaufgabe. Eine menschliche Aufgabe ist definiert als das Vorkommen, dass ein menschlicher Mitarbeiter eine Bewertung einer einzelnen Aufforderung und der zugehörigen Inferenzantworten in der Benutzeroberfläche für die menschliche Bewertung abgibt. Der Preis ist derselbe, unabhängig davon, ob Sie ein oder zwei Modelle in Ihrer Bewertungsaufgabe haben oder Ihre eigene Inferenz mitbringen, und auch derselbe, unabhängig davon, wie viele Bewertungsdimensionen und Bewertungsmethoden Sie einbeziehen. Der Preis pro Aufgabe von 0,21 USD ist für alle AWS-Regionen gleich. Für die Belegschaft fallen keine gesonderten Kosten an, da die Belegschaft von Ihnen gestellt wird.

Von AWS verwaltete Bewertung:
Für eine von AWS verwaltete Expertenbewertung werden die Preise in einem privaten Gespräch und in Zusammenarbeit mit dem AWS-Expertenbewertungsteam an Ihre Bewertungsanforderungen angepasst.

Amazon SageMaker Studio Lab

Sie können ML-Modelle mit Amazon SageMaker Studio Lab kostenlos entwickeln und trainieren. SageMaker Studio Lab bietet Entwicklern, Akademikern und Datenwissenschaftlern eine konfigurationsfreie Umgebung zum Lernen und Experimentieren mit ML, ohne dass zusätzliche Kosten anfallen.

Amazon SageMaker Canvas

Amazon SageMaker Canvas erweitert den ML-Zugriff, indem es Geschäftsanalysten die Möglichkeit bietet, mithilfe einer visuellen Point-and-Click-Oberfläche genaue ML-Vorhersagen zu generieren – ohne Programmier- oder ML-Erfahrung.

Amazon-SageMaker-Datenbeschriftung

Die Amazon-SageMaker-Datenbeschriftung liefert zwei Datenbeschriftungs-Angebote, Amazon SageMaker Ground Truth Plus und Amazon SageMaker Ground Truth. Erfahren Sie mehr über die Amazon-SageMaker-Datenbeschriftung, einen vollständig verwalteten Datenbeschriftungs-Service, mit dem Sie ganz einfach hochpräzise Trainings-Datensätze für ML entwickeln können.

Amazon-SageMaker-Schattentests

Mit SageMaker können Sie Schattentests durchführen, um ein neues ML-Modell vor der Produktionsfreigabe zu evaluieren, indem Sie seine Leistung im Vergleich zum aktuell eingesetzten Modell testen. Für SageMaker-Schattentests fallen außer den Nutzungsgebühren für die ML-Instances und den ML-Speicher, die zum Hosten des Schattenmodells bereitgestellt werden, keine zusätzlichen Gebühren an. Die Preise für ML-Instanzen und ML-Speicherdimensionen sind dieselben wie für die Echtzeit-Inferenzoption, die in der vorangehenden Preistabelle angegeben ist. Es fallen keine zusätzlichen Gebühren für Daten an, die innerhalb und außerhalb von Schattenbereitstellungen verarbeitet werden.

Amazon SageMaker Edge

Erfahren Sie mehr über die Preise von Amazon SageMaker Edge zur Optimierung, Ausführung und Überwachung von ML-Modellen auf Flotten von Geräten am Netzwerkrand.

Savings Plans für Amazon SageMaker

Mit den Amazon SageMaker Savings Plans können Sie Ihre Kosten um bis zu 64 % senken. Die Pläne gelten automatisch für die Nutzung berechtigter SageMaker-ML-Instances, einschließlich SageMaker-Studio-Notebooks, SageMaker-Notebook-Instances, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference und SageMaker Batch Transform, unabhängig von der Instance-Familie, Größe oder Region. Sie können zum Beispiel jederzeit die Nutzung einer CPU-Instance ml.c5.xlarge, die in USA Ost (Ohio) läuft, auf eine ml.Inf1-Instance in USA West (Oregon) für Inferenz-Workloads ändern und automatisch den Preis des Savings Plans weiter bezahlen.

Weitere Informationen »

Gesamtbetriebskosten (TCO) mit Amazon SageMaker

Amazon SageMaker bietet mindestens 54 % niedrigere Gesamtbetriebskosten (TCO) über einen Zeitraum von drei Jahren im Vergleich zu anderen selbstverwalteten cloudbasierten Lösungen. Erfahren Sie mehr mit der vollständigen TCO-Analyse für Amazon SageMaker.

Preisbeispiele

Preisbeispiel 1: JupyterLab

Als Datenwissenschaftler verbringen Sie 20 Tage damit, JupyterLab für schnelle Experimente mit Notebooks, Code und Daten für 6 Stunden pro Tag auf einer ml.g4dn.xlarge-Instance zu verwenden. Sie erstellen einen JupyterLab-Space und führen ihn dann aus, um auf die JupyterLab-IDE zuzugreifen. Die Rechenleistung wird nur für die Instance berechnet, die verwendet wird, wenn der JupyterLab-Speicherplatz läuft. Die Speichergebühren für einen JupyterLab-Speicherplatz fallen an, bis er gelöscht wird.

Datenverarbeitung

Instance	Dauer	Tage	Gesamtdauer	Kosten pro Stunde	Gesamtsumme
ml.g4dn.xlarge	6 Stunden	20	6 * 20 = 120 Stunden	0,7364 USD	88,368 USD

Speicher

Sie werden den Allzweck-SSD-Speicher 480 Stunden lang (24 Stunden* 20 Tage) verwenden. In einer Region, die 0,1125 USD pro GB-Monat berechnet:
0,112 USD pro GB-Monat * 5 GB * 480 / (24 Stunden/Tag * 30-Tage-Monat) = 0,373 USD

Preisbeispiel 2: Code-Editor

Als ML-Ingenieur verbringen Sie 20 Tage damit, den Code-Editor für die Bearbeitung, Ausführung und das Debuggen von ML-Produktionscode für 6 Stunden pro Tag auf einer ml.g4dn.xlarge-Instance zu verwenden. Sie erstellen einen Code-Editor-Bereich und führen ihn dann aus, um auf die Code-Editor-IDE zuzugreifen. Die Rechenleistung wird nur für die Instance berechnet, die verwendet wird, wenn der Code-Editor-Speicherplatz läuft. Die Speichergebühren für einen Code-Editor fallen an, bis er gelöscht wird.

Datenverarbeitung

Instance	Dauer	Tage	Gesamtdauer	Kosten pro Stunde	Gesamtsumme
ml.g4dn.xlarge	6 Stunden	20	6 * 20 = 120 Stunden	0,7364 USD	88,368 USD

Speicher

Preisbeispiel 3: Studio Classic

Ein Datenwissenschaftler durchläuft bei der Verwendung von Notebooks in Amazon SageMaker Studio Classic die folgende Abfolge von Aktionen:

Öffnet Notebook 1 in einem TensorFlow-Kernel auf einer ml.c5.xlarge-Instance und arbeitet dann 1 Stunde lang auf diesem Notebook.
Öffnet Notebook 2 auf einer ml.c5.xlarge-Instance. Es wird automatisch in der gleichen ml.c5.xlarge-Instance geöffnet, in der auch Notebook 1 ausgeführt wird.
Arbeitet 1 Stunde lang gleichzeitig an Notebook 1 und an Notebook 2.
Dem Daten-Wissenschaftler werden insgesamt 2 Stunden der Verwendung von ml.c5.xlarge in Rechnung gestellt. Für die überlappende Stunde, in der sie gleichzeitig an Notebook 1 und Notebook 2 gearbeitet hat, wird jede Kernel-Anwendung für 0,5 Stunden gemessen und ihr 1 Stunde in Rechnung gestellt.

Kernel-Anwendung	Notebook-Instance	Stunden	Kosten pro Stunde	Gesamtsumme
TensorFlow	ml.c5.xlarge	1	0,204 USD	0,204 USD
TensorFlow	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Datenwissenschaft	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Preisbeispiel 4: RStudio

Ein Datenwissenschaftler führt die folgenden Aktionen durch, während sie RStudio verwendet:

Launcht RSession 1 auf einer ml.c5.xlarge-Instance und arbeitet dann 1 Stunde lang an diesem Notebook.
Startet RSession 2 auf einer ml.c5.xlarge Instance. Es wird automatisch in der gleichen ml.c5.xlarge-Instance geöffnet, in der auch RSession 1 ausgeführt wird.
Arbeitet 1 Stunde lang gleichzeitig an RSesssion 1 und RSession 2.
Dem Daten-Wissenschaftler werden insgesamt zwei (2) Stunden der Verwendung von ml.c5.xlarge in Rechnung gestellt. Für die sich überschneidende Stunde, in der sie gleichzeitig an RSession 1 und RSession 2 gearbeitet hat, wird jede RSession-Anwendung mit 0,5 Stunden berechnet und ihr wird 1 Stunde in Rechnung gestellt.

In der Zwischenzeit läuft der RServer 24/7, egal ob RSessions laufen oder nicht. Wenn der Admin „Small“ (ml.t3.medium) wählt, dann ist es kostenlos. Wählt der Admin "Medium" (ml.c5.4xlarge) oder "Large" (ml.c5.9xlarge), so wird stundenweise abgerechnet, sofern RStudio für die SageMaker-Domäne aktiviert ist.

RSession-App	RSession-Instance	Stunden	Kosten pro Stunde	Gesamtsumme
Base R	ml.c5.xlarge	1	0,204 USD	0,204 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Preisbeispiel 5: Verarbeitung

Für die Verarbeitung in Amazon SageMaker fallen nur Gebühren für die genutzte Instance während der Ausführung Ihrer Aufträge an. Wenn Sie die Eingabedaten zur Verarbeitung in Amazon S3 bereitstellen, lädt Amazon SageMaker die Daten zu Beginn der Verarbeitungsaufgabe aus Amazon S3 auf einen lokalen Dateispeicher herunter.

Der Datenanalyst führt einen Auftrag zur Vorverarbeitung und Validierung von Daten auf zwei ml.m5.4xlarge-Instances für eine Auftragsdauer von 10 Minuten aus. Sie lädt einen Datensatz von 100 GB in S3 als Eingabe für den Verarbeitungsauftrag hoch, und die Ausgabedaten (die ungefähr die gleiche Größe haben) werden wieder in S3 gespeichert.

Stunden	Verarbeitungs-Instances	Preis pro Stunde	Gesamtsumme
1 * 2 * 0,167 = 0,334	ml.m5.4xlarge	0,922 USD	0,308 USD

Universell-Speicher (SSD) (GB)	Preis pro Stunde	Gesamtsumme
100 GB * 2 = 200	0,14 USD	0,0032 USD

Die Zwischensumme für den Amazon-SageMaker-Verarbeitungsauftrag = 0,308 USD.
Zwischensumme für 200 GB an Universell-Speicher (SSD) = 0,0032 USD.
In diesem Beispiel würden insgesamt 0,3112 USD berechnet werden.

Preisbeispiel 6: Data Wrangler

Laut Tabelle verwenden Sie Amazon SageMaker Data Wrangler für insgesamt 18 Stunden über 3 Tage, um Ihre Daten aufzubereiten. Zusätzlich legen Sie eine SageMaker Data Wrangler-Aufgabe an, um wöchentlich aktualisierte Daten vorzubereiten. Jede Aufgabe dauert 40 Minuten, und sie wird wöchentlich einen Monat lang ausgeführt.

Monatliche Gesamtgebühren für die Nutzung von Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

Anwendung	SageMaker-Studio-Instance	Tage	Dauer	Gesamtdauer	Kosten pro Stunde	Kosten Zwischensumme
SageMaker Data Wrangler	ml.m5.4xlarge	3	6 Stunden	18 Stunden	0,922 USD	16,596 USD
SageMaker Data Wrangler-Aufgabe	ml.m5.4xlarge	-	40 Minuten	2,67 Stunden	0,922 USD	2,461 USD

Als Datenwissenschaftler verbringen Sie drei Tage, 6 Stunden pro Tag, mit Amazon SageMaker Data Wrangler, um Ihre Daten zu bereinigen, zu erforschen und zu visualisieren. Zum Ausführen Ihrer Datenaufbereitungspipeline initiieren Sie dann eine SageMaker Data Wrangler-Aufgabe, die für eine wöchentliche Ausführung geplant ist.

In der nachstehenden Tabelle sind Ihre Gesamtnutzung für den Monat und die damit verbundenen Gebühren für die Nutzung von Amazon SageMaker Data Wrangler zusammengefasst.

Preisbeispiel 7: Feature Store

++ Alle gebrochenen Leseeinheiten werden auf die nächste ganze Zahl gerundet

Datenspeicher
Insgesamt gespeicherte Daten = 31,5 GB
Monatliche Kosten für Datenspeicher = 31,5 GB * 0,45 USD = 14,175 USD

Monatliche Gesamtgebühren für Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

Tag des Monats	Gesamtsumme Schreibvorgänge	Gesamtsumme Schreibeinheiten	Gesamtsumme Lesevorgänge	Gesamtsumme Leseeinheiten
Tage 1 bis 10	100 000 Schreibvorgänge (10 000 Schreibvorgänge * 10 Tage)	2 500 000 (100 000 * 25KB )	100 000 (10 000 * 10 Tage)	700 000++ (100 000 * 25/4 KB)

Tag 11	200 000 Schreibvorgänge	5 000 000 (200 000 * 25KB )	200 000 Lesevorgänge	1 400 000++ (200 000 * 25/4KB )

Tage 12 bis 30	1 520 000 Schreibvorgänge (80 000 * 19 Tage)	38 000 000 (1 520 000 * 25 KB)	1 520 000 Schreibvorgänge (80 000 * 19 Tage)	10 640 000++ (1 520 000 * 25/4 KB)

Total kostenpflichtige Einheiten		45 500 000 Schreibeinheiten		12 740 000 Leseeinheiten
Monatliche Gebühren für Schreib- und Lesevorgänge		56.875 USD (45,5 Millionen Schreibeinheiten * 1,25 USD pro Million Schreibvorgänge)		3,185 USD (12,74 Mio. Leseeinheiten * 0,25 USD pro Mio. Lesevorgänge)

Sie haben eine Webanwendung, die Lese- und Schreibvorgänge von jeweils 25 KB in den Amazon SageMaker Feature Store ausführt. In den ersten 10 Tagen eines Monats verzeichnet Ihre Anwendung nur wenig Datenverkehr, sodass jeden Tag 10 000 Schreibvorgänge und 10 000 Lesevorgänge im SageMaker Feature Store stattfinden. An Tag 11 des Monats gewinnt Ihre Anwendung Aufmerksamkeit in den sozialen Medien und der Anwendungs-Traffic steigt an diesem Tag auf 200.000 Schreibvorgänge und 200.000 Lesevorgänge. Ihre Anwendung reguliert sich zum Monatsende zu einem gleichmäßigeren Verkehrsaufkommen mit durchschnittlich 80 000 Lese- und 80 000 Schreibvorgängen pro Tag.

In der nachstehenden Tabelle sind Ihre Gesamtnutzung für den Monat und die damit verbundenen Gebühren für die Nutzung des Amazon SageMaker Feature Store zusammengefasst.

Preisbeispiel 8: Training

Die Gesamtkosten für Training und Debugging betragen in diesem Beispiel 2,38 USD. Für die Computing-Instances und die Universell-Speicher-Volumes, die von den in Amazon SageMaker Debugger integrierten Regeln verwendet werden, fallen keine zusätzlichen Gebühren an.

	Universell-Speicher (SSD) für Training (GB)	Universell-Speicher (SSD) für in den Debugger integrierte Regeln (GB)	Universell-Speicher (SSD) für benutzerdefinierte Debugger-Regeln (GB)	Preis pro GB/Monat	Zwischensumme
Genutzte Kapazität	3	2	1
Kosten	0 USD	Keine zusätzlichen Gebühren für integrierte Speichervolumes	0 USD	0,10 USD	0 USD

Stunden	Training-Instance	Debug-Instance	Preis pro Stunde	Zwischensumme
4 * 0,5 = 2,00	ml.m4.4xlarge	–	0,96 USD	1,92 USD
4 * 0,5 * 2 = 4	–	Keine zusätzlichen Gebühren für integrierte Regel-Instances	0 USD	0 USD
4 * 0,5 = 2	ml.m5.xlarge	–	0,23 USD	0,46 USD
				-------
				2,38 USD

Ein Datenwissenschaftler hat eine Woche lang an einem Modell für ein neues Konzept gearbeitet. Er trainiert das Modell vier Mal auf einem ml.m4.4xlarge für 30 Minuten pro Trainingslauf, wobei Amazon SageMaker Debugger mit zwei integrierten Regeln einer selbst geschriebenen Regel aktiviert ist. Bei der benutzerdefinierten Regel legte er die ml.m5.xlarge-Instance fest. Sie führt das Training mit einem Trainings-Datenvolumen von 3 GB in Amazon S3 aus und gibt 1 GB an Modellausgabe an Amazon S3 weiter. SageMaker erstellt Universell-Speicher SSD (gp2)-Volumes für jede Trainings-Instance. SageMaker erstellt außerdem Universell-Speicher SSD (gp2)-Volumes für jede definierte Regel. In diesem Beispiel werden insgesamt vier Universell-Speicher SSD (gp2)-Volumes erstellt. SageMaker Debugger gibt 1 GB Debug-Daten an den Amazon-S3-Bucket des Kunden aus.

Preisbeispiel Nr. 9: Experimente

	Kosten	Gesamteinheiten	Monatliche Gebühr
Aufnahme	1,25 USD pro Million Metrikdatensätze	1 Million (=1 000 Datenwissenschaftler * 10 Mal * 20 Epochen * 5 Metriken) erfasste Metrikdatensätze	1,25 USD (= 1,25 * 1)
Verwendung von SageMaker Studio	0 USD		0 USD
Abruf	0,25 USD pro Million Metrikdatensätze	10 Millionen (= 1 Million erfasste Metriken * 10 Abrufe pro erfasster Metrik) abgerufene Metrik-Datensätze	2,5 USD (= 0,25 * 10)
Speicherung	0,25 USD pro Million Metrikdatensätze – Monat	1 Million gespeicherte Metrikdatensätze	0,25 USD (= 0,25 * 1)
Monatliche Gesamtgebühr			4 USD

Sie haben eine ML-Workbench, die von 1 000 Datenwissenschaftlern verwendet wird. Diese führen Experimente durch, indem sie ihre Modelle mit verschiedenen Parametern und Datensätzen trainieren. Jeder Datenwissenschaftler trainiert ein Modell zehnmal pro Monat über 20 Epochen und erfasst fünf benutzerdefinierte Metriken. Die Workbench verwendet Abruf-APIs, um Experimentdaten von SageMaker-Experimenten für benutzerdefinierte Analysen abzurufen. Die Datenwissenschaftler vergleichen ihre aufgezeichneten Daten über zehn verschiedene Trainingsiterationen hinweg, um das beste Kandidatenmodell zu finden. In diesem Beispiel würden die Gebühren wie folgt aussehen:

	Kosten	Gesamteinheiten	Monatliche Gebühr
Aufnahme	1,25 USD pro Million Metrikdatensätze	100 000 (= 100 Datenwissenschaftler * 10 Mal * 20 Epochen * 5 Metriken) erfasste Metrikdatensätze	0 125 USD (= 1,25 * 100 000/1 000 000)
Verwendung von SageMaker Studio	0 USD		0 USD
Abruf	0,25 USD pro Million Metrikdatensätze	0	0 USD
Speicherung	0,25 USD pro Million Metrikdatensätze – Monat	100 000 gespeicherte Metrikdatensätze	0 025 USD (= 0,25 * 100 000/1 000 000)
Monatliche Gesamtgebühr			0,15 USD

Ein Team von 100 Datenwissenschaftlern arbeitet an einem Projekt für eine neue Idee. Diese führen Experimente durch, indem sie ihre Modelle mit verschiedenen Parametern und Datensätzen trainieren. Im Durchschnitt trainiert jeder Datenwissenschaftler ein Modell zehnmal im Monat über 20 Epochen und erfasst fünf benutzerdefinierte Metriken. Die Datenwissenschaftler verwenden SageMaker Studio, um ihre Experimente zu analysieren. In diesem Beispiel würden die Gebühren wie folgt aussehen:

Preisbeispiel Nr. 10: Echtzeit-Inferenz

Die Zwischensumme für Training, Hosting und Überwachung beträgt 305,827 USD. Die Zwischensumme für 3 100 MB an verarbeiteten Vorgängen und 310 MB an verarbeiteten Vorgängen für das Hosting pro Monat = 0,054 USD. In diesem Beispiel würden insgesamt 305,881 USD pro Monat berechnet.

Hinweis: Für integrierte Regeln mit einer ml.m5.xlarge-Instance erhalten Sie bis zu 30 Stunden Überwachung, für alle Endpunkte pro Monat aggregiert, ohne Zusatzkosten.

Eingehende Daten pro Monat – Hosting	Ausgehende Daten pro Monat – Hosting	Preis pro GB (ein- oder ausgehend)	Gesamtsumme
100 MB * 31 = 3 100 MB		0,016 USD	0,0496 USD
	10 MB * 31 = 310 MB	0,016 USD	0,00496 USD

Stunden pro Monat	Hosting-Instances	Modellüberwachungs-Instances	Preis pro Stunde	Gesamtsumme
24 * 31 * 2 = 1 488	ml.c5.xlarge		0,204 USD	303,522 USD
31 * 0,08 = 2,5		ml.m5.4xlarge	0,922 USD	2,305 USD

Das Modell in Beispiel Nr. 5 wird in zwei (2) ml.c5.xlarge-Instances für ein zuverlässiges Multi-AZ-Hosting zur Produktion bereitgestellt. Die Amazon-SageMaker-Modellüberwachung ist mit einer (1) ml.m5.4xlarge-Instance aktiviert, und die Überwachungsaufträge sind so geplant, dass sie einmal pro Tag ausgeführt werden. Die Ausführung der Überwachungsaufträge dauert fünf Minuten. Das Modell erhält täglich 100 MB an Daten, und die Inferenzen umfassen 1/10 der Eingabedatenmenge.

Preisbeispiel Nr. 11: Asynchrone Inferenz

Die Zwischensumme für SageMaker Asynchronous Inference = 15,81 USD + 0,56 USD + 2 * 0,0048 USD = 16,38 USD. Die Gesamtgebühren für Asynchronous Inference betragen in diesem Beispiel 16,38 USD pro Monat.

Dateneingang pro Monat	Datenausgang pro Monat	Kosten pro GB (ein- oder ausgehend)	Gesamtsumme
10 KB * 1,024 * 31 = 310 MB	10 KB * 1,024 * 31 = 310 MB	0,02 USD	0,0048
	10 KB * 1,024 * 31 = 310 MB	0,02 USD	0,0048

Universell-Speicher (SSD) (GB)	Preis pro GB/Monat	Gesamtsumme
4	0,14 USD	0,56 USD

Stunden pro Monat	Hosting-Instances	Kosten pro Stunde	Gesamtsumme
2,5 * 31 * 1 = 77,5	ml.c5.xlarge	0,20 USD	15,81 USD

Amazon SageMaker Asynchronous Inference berechnet Ihnen die von Ihrem Endpunkt verwendeten Instances. Wenn Sie keine aktiven Anforderungen bearbeiten, können Sie, um Kosten zu sparen, die automatische Skalierung so konfigurieren, dass die Anzahl der Instances auf Null reduziert wird. Für Eingabe-Nutzlasten in Amazon S3 fallen keine Kosten für das Lesen von Eingabedaten aus Amazon S3 und das Schreiben der Ausgabedaten in S3 in derselben Region an.

Das Modell in Beispiel Nr. 5 wird verwendet, um einen Endpunkt von SageMaker Asynchronous Inference auszuführen. Der Endpunkt ist so konfiguriert, dass er auf einer ml.c5.xlarge Instance läuft und die Anzahl der Instances auf Null reduziert, wenn er nicht aktiv Anforderungen verarbeitet. Die Instance ml.c5.xlarge im Endpunkt verfügt über 4 GB an universellem (SSD) Speicher, der ihr angefügt ist. In diesem Beispiel behält der Endpunkt eine Instance-Anzahl von 1 für 2 Stunden pro Tag bei und hat eine Ruhephase von 30 Minuten. Danach wird er für den Rest des Tages auf eine Instance-Anzahl von Null heruntergefahren. Es werden also 2,5 Stunden Nutzung pro Tag berechnet.

Der Endpunkt verarbeitet 1,024 Anforderungen pro Tag. Die Größe jedes Aufrufs-Anforderung/Antwort-Paket beträgt 10 KB, und die Nutzlast jeder Inferenz-Anforderung in Amazon S3 beträgt 100 MB. Die Inferenzausgaben sind 1/10 so groß wie die Eingabedaten, die wieder in Amazon S3 in derselben Region gespeichert werden. In diesem Beispiel gelten die Datenverarbeitungs-Gebühren für die Anfrage und die Antwort, nicht aber für die Daten, die zu/von Amazon S3 übertragen werden.

Preisbeispiel Nr. 12: Batch Transform

Die Gesamtkosten für Inferenz belaufen sich in diesem Beispiel auf 2,88 USD.

Stunden	Hosting-Instances	Kosten pro Stunde	Gesamtsumme
3 * 0,25 * 4 = 3 Stunden	ml.m4.4xlarge	0,96 USD	2,88 USD

Das Modell in Beispiel 5 wird zur Ausführung von SageMaker Batch Transform verwendet. Der Datenwissenschaftler führt vier separate SageMaker-Batch-Transformationsaufgaben auf 3 ml.m4.4xlarge-Instances für jeweils 15 Minuten pro Aufgabenausführung aus. Dabei wird für jede Ausführung in S3 ein Bewertungsdatensatz mit 1 GB hochgeladen. Die Inferenzen haben 1/10 der Größe der in S3 gespeicherten Eingabedaten.

Preisbeispiel 13: On-Demand-Serverless-Inference

Monatliche Datenverarbeitungsgebühren

Datenverarbeitung (GB)	Kosten pro GB (ein- oder ausgehend)	Monatliche Datenverarbeitungsgebühr
10 GB	0,016 USD	0,16 USD

Die Zwischensumme der Gebühr für die Dauer von SageMaker Serverless Inference = 40 USD. Die Zwischensumme der Datenverarbeitungsgebühr für 10 GB = 0,16 USD. In diesem Beispiel würden insgesamt 40,16 USD berechnet.

Monatliche Computing-Gebühren

Anzahl der Anforderungen	Dauer jeder Anfrage	Gesamtdauer der Inferenz (Sek.)	Preis pro Sekunde	Monatliche Gebühr für die Inferenzdauer
10 M	100 ms	1 Mio.	0,00004 USD	40 USD

Bei On-Demand-Serverless-Inference bezahlen Sie nur für die Rechenkapazität, die für die Verarbeitung von Inferenz-Anforderungen verwendet wird, die nach Millisekunden und verarbeiteter Datenmenge abgerechnet wird. Die Datenverarbeitungsgebühr hängt von der ausgewählten Arbeitsspeicher-Konfiguration ab.

Wenn Sie Ihrem Endpunkt 2 GB Arbeitsspeicher zuweisen, ihn in einem Monat 10 Millionen Mal ausführen und jedes Mal 100 ms laufen lassen und insgesamt 10 GB an Dateneingängen und -ausgängen verarbeiten, würden Ihre Kosten wie folgt berechnet:

Preisbeispiel 14: Provisioned Concurrency bei Serverless-Inferenz

Nehmen wir an, Sie betreiben einen Chat-Bot-Service für ein Unternehmen, das Lohn- und Gehaltsabrechnungen abwickelt. Sie erwarten Ende März, also noch vor Ablauf der Frist für die Steuererklärung, einen Anstieg der Kundenanfragen. Für den Rest des Monats wird jedoch mit einem geringen Verkehr gerechnet. Sie stellen also einen serverlosen Endpunkt mit 2 GB Arbeitsspeicher bereit und fügen für die letzten 5 Tage des Monats von 9 bis 17 Uhr (8 Stunden) Provisioned Concurrency von 100 hinzu. In dieser Zeit verarbeitet Ihr Endpunkt 10 Mio. Anfragen und insgesamt 10 GB an ein-/ausgehenden Daten. Den Rest des Monats läuft der Chat-Bot auf On-Demand Serverless Inference und verarbeitet 3 Mio. Anfragen und 3 GB Datenein-/Ausgang. Gehen wir davon aus, dass die Dauer jeder Anfrage 100 ms beträgt.

Provisioned Concurrency (PC) – Gebühren
Der PC-Preis beträgt 0,000010 USD pro Sekunde
PC-Nutzungsdauer (Sekunden) = 5 Tage* 100 PC* 8 Stunden* 3.600 Sekunden = 14.400.000 Sekunden
PC-Nutzungsgebühr = 14.400.000 Sekunden* 0,000010 USD pro Sekunde = 144 USD.

Gebühren für die Inferenzdauer für Datenverkehr, der von Provisioned Concurrency bedient wird
Der Preis für die Inferenzdauer beträgt 0,000023 USD pro Sekunde
Gesamtdauer der Inferenz für PC (s) = 10 M* (100 ms) /1.000 = 1 M Sekunden.
Gebühren für die Inferenzdauer für PC = 1.000.000 Sek. * 0,000023 USD pro Sekunde =23 USD

Gebühren für die Dauer der Inferenz auf Abruf
Der monatliche Preis für Computing beträgt 0,00004 USD pro Sekunde und im kostenlosen Kontingent stehen 150.000 Sekunden zur Verfügung.
Gesamtrechenleistung (Sekunden) = (3) M * (100 ms) /1000 = 0,3 Mio. Sekunden.
Datenverarbeitung gesamt – Datenverarbeitung kostenloses Kontingent = monatliche gebührenpflichtige Datenverarbeitung in Sekunden
0,3 Mio. Sekunden – 150.000 Sekunden = 150.000 Sekunden
Monatliche Datenverarbeitungsgebühr = 150.000 * 0,00004 USD = 6 USD

Datenverarbeitung
Kosten/GB verarbeiteter Daten eingehend/ausgehend = 0,016 USD
Insgesamt verarbeitete GB = 10 + 3 = 13
Gesamtkosten = 0,016 USD*13 = 0,208 USD

Gesamtkosten für März
Gesamtkosten = Bereitgestellte Parallelitätsgebühren + Inferenzdauer für bereitgestellte Parallelität + Inferenzdauer für On-Demand-Computing + Datenverarbeitungsgebühren
= 144 USD +23 USD + 6 USD + 0,208 USD = 173,2 USD

Preisbeispiel Nr. 15: JumpStart

Der Kunde nutzt JumpStart, um ein vorab trainiertes BERT-Base-Uncased-Modell bereitzustellen, um die Stimmung der Kundenrezensionen als positiv oder negativ zu einzustufen.

Der Kunde setzt das Modell auf zwei (2) ml.c5.xlarge-Instances für zuverlässiges Multi-AZ-Hosting ein. Das Modell erhält täglich 100 MB an Daten, und die Inferenzen umfassen 1/10 der Eingabedatenmenge.

Stunden pro Monat	Hosting-Instances	Kosten pro Stunde	Gesamtsumme
24 * 31 * 2 = 1 488	ml.c5.xlarge	0,204 USD	303,55 USD

Eingehende Daten pro Monat – Hosting	Ausgehende Daten pro Monat – Hosting	Kosten pro GB (ein- oder ausgehend)	Gesamtsumme
100 MB * 31 = 3 100 MB		0,02 USD	0,06 USD
	10 MB * 31 = 310 MB	0,02 USD	0,01 USD

Die Zwischensumme für Training, Hosting und Überwachung beträgt 305,827 USD. Die Zwischensumme für 3 100 MB an verarbeiteten eingehenden Daten und 310 MB an verarbeiteten ausgehenden Daten für Hosting pro Monat = 0,06 USD. In diesem Beispiel würden insgesamt 305,887 USD pro Monat berechnet.

Preisbeispiel 16: HyperPod

Angenommen, Sie möchten einen Cluster von 64 p5 für 3 Monate ununterbrochener Nutzung, um die durchgängige Modellbereitstellung zu unterstützen.

Stunden	Training-Instance	Kosten pro Stunde
3 Monate * 30 Tage * 24 Stunden = 2 160 Stunden	ml.p5.48xlarge	113,07 USD

Die Gesamtgebühren für den Cluster betragen in diesem Beispiel 244 321,20 USD

Preisbeispiel Nr. 17: Bewertungen von Grundlagenmodellen (automatische Bewertung)

Bewertungen von Grundlagenmodellen mit SageMaker Clarify berechnen Ihnen nur die Instances, die während der Ausführung Ihrer automatischen Bewertungsaufträge verwendet werden. Wenn Sie eine automatische Bewertungsaufgabe und einen Datensatz auswählen, lädt SageMaker den Eingabeaufforderungsdatensatz von Amazon S3 auf eine SageMaker-Bewertungs-Instance.

Im folgenden Beispiel führt ein ML-Techniker eine Bewertung des Llama2-7B-Modells in USA-Ost (Nord-Virginia) durch, um die Genauigkeit der Zusammenfassungsaufgabe zu ermitteln. Der empfohlene Instance-Typ für Inferenz für Llama 2 7B lautet ml.g5.2xlarge. Die empfohlene Mindest-Instance für eine Bewertung lautet ml.m5.2xlarge. In diesem Beispiel wird der Auftrag 45 Minuten lang ausgeführt (abhängig von der Größe des Datensatzes). In diesem Beispiel würden die Kosten für den Bewertungsauftrag und die detaillierten Ergebnisse 1,48 USD betragen.

Bearbeitung von Arbeitsstunden (Beispiel)	Region	Instance-Typ	Instance	Kosten pro Stunde	Kosten
0,45	US-east-1	LLM-Hosting	ml.g5.2xlarge	1,52 USD	1,14 USD
0,45	US-east-1	Auswertung	ml.m5.2xlarge	0,46 USD	0,35 USD
Gesamtsumme					1,48 USD

Im nächsten Beispiel führt derselbe Techniker in Virginia einen weiteren Bewertungsauftrag für die Genauigkeit der Zusammenfassungsaufgabe aus, verwendet jedoch eine angepasste Version von Llama 2 7B, die für seinem Konto bereitgestellt und ausgeführt wird. Da das Modell in diesem Fall bereits auf ihrem Konto bereitgestellt ist, fallen die einzigen zusätzlichen Kosten für die Bewertungs-Instance an.

Bearbeitung von Arbeitsstunden	Region	Instance-Typ	Instance	Kosten pro Stunde	Kosten
0,45	US-east-1	Auswertung	ml.m5.2xlarge	0,46 USD	0,35 USD
Gesamtsumme					0,35 USD

Preisbeispiel Nr. 18: Bewertungen von Grundlagenmodellen (Bewertung durch Menschen)

Im folgenden Beispiel führt ein Techniker für Machine Learning in USA Ost (N. Virginia) eine menschenbasierte Bewertung von Llama-2-7B für die Genauigkeit der Zusammenfassungsaufgabe aus und verwendet für die Bewertung seine eigenen privaten Worker. Der empfohlene Instance-Typ für Llama-2-7B lautet ml.g5.2xlarge. Die empfohlene Mindest-Instance für einen von Menschen bewerteten Verarbeitungsauftrag lautet ml.t3.medium. Die Inferenz auf Llama-2-7B dauert 45 Minuten (abhängig von der Größe des Datensatzes). Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 2 Worker, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Worker pro Eingabeaufforderung“). Dieser Bewertungsauftrag umfasst 100 Aufgaben (1 Aufgabe für jedes Eingabeaufforderungs-/Antwortpaar pro Worker: 2 Worker x 50 Eingabeaufforderungs-/Antwortsätze = 100 menschliche Aufgaben). Die menschliche Belegschaft benötigt einen Tag (24 Stunden), um alle 100 menschlichen Bewertungsaufgaben des Bewertungsauftrags zu erledigen (abhängig von der Anzahl und dem Kompetenzniveau der Worker und der Länge/Komplexität der Eingabeaufforderungen und Inferenzantworten).

Stunden berechnen	Menschliche Aufgaben	Region	Instance-Typ	Instance	Kosten pro Stunde	Kosten pro menschlicher Aufgabe	Gesamtkosten
0,45		USA Ost (Nord-Virginia)	LLM-Hosting	ml.g5.2xlarge	1,52 USD		1,14 USD
24		USA Ost (Nord-Virginia)	Auftrag wird verarbeitet	ml.t3.medium	0,05 USD		1,20 USD
	100	Beliebig				0,21 USD	21,00 USD
Gesamtsumme							23,34 USD

Im nächsten Beispiel führt derselbe Techniker in USA Ost (Nord-Virginia) denselben Bewertungsauftrag aus, verwendet jedoch Llama-2-7B, das bereits in seinem Konto bereitgestellt und betriebsbereit ist. In diesem Fall würden die einzigen zusätzlichen Kosten für die Bewertungsverarbeitung und menschliche Aufgaben anfallen.

Stunden berechnen	Menschliche Aufgaben	Region	Instance-Typ	Instance	Kosten pro Stunde	Kosten pro menschlicher Aufgabe	Gesamtkosten
24		USA Ost (Nord-Virginia)	Auftrag wird verarbeitet	ml.t3.medium	0,05 USD		1,20 USD
	100	Beliebig				0,21 USD	21,00 USD
Gesamtsumme							22,20 USD

Nächste Schritte

Features page

Eine Vielzahl von SageMaker-Funktionen entdecken

Weitere Informationen

Console

Erste Schritte mit der Entwicklung mit SageMaker in der AWS-Managementkonsole

Jetzt registrieren

Amazon SageMaker – Preise