Preise für Amazon Bedrock AgentCore (Vorschau)
Passen Sie AgentCore an Ihre Bedürfnisse an – kombinieren Sie Services, nutzen Sie sie unabhängig oder zusammen und zahlen Sie für das, was Sie nutzen, wenn Ihre KI-Initiativen wachsen.
Sie zahlen nur für das, was Sie nutzen
Amazon Bedrock AgentCore bietet flexible, verbrauchsorientierte Preise ohne Vorabverpflichtungen oder Mindestgebühren. Jeder Service – Runtime, Tools (Browser, Code Interpreter), Gateway, Identity, Memory und Observability – kann unabhängig oder zusammen verwendet werden, und Sie zahlen nur für das, was Sie nutzen. Dieser modulare Ansatz ermöglicht es Ihnen, klein anzufangen und zu skalieren, wenn Ihre Anwendungen des KI-Agenten weiterentwickelt werden.
Sie können die AgentCore-Services bis zum 16. September 2025 kostenlos testen. Die AWS-Standardpreise gelten für alle zusätzlichen AWS-Services, die im Rahmen der Nutzung von AgentCore verwendet werden (z. B. gelten die CloudWatch-Preise für AgentCore Observability). Ab dem 17. September 2025 stellt Ihnen AWS die Nutzung des AgentCore-Service auf der Grundlage dieser Seite in Rechnung.
Bedrock-AgentCore-Services
Runtime
AgentCore Runtime ist eine sichere Serverless-Runtime, die speziell für die Bereitstellung und Skalierung dynamischer KI-Agenten und -Tools entwickelt wurde.
Verbrauchsorientierte Preisgestaltung
Sie zahlen nur für das, was Sie nutzen, ohne dass eine Vorkonfiguration der Ressourcen erforderlich ist. CPU-Ressourcen werden Ihnen berechnet, wenn Ihr Agent aktiv eine Verarbeitung durchführt (nicht während E/A-Wartezeiten, wenn Sie nur auf LLM-Antworten warten). Bei Arbeitsspeicher-Ressourcen wird Ihnen nur der Speicherplatz in Rechnung gestellt, den Ihr Agent verbraucht.
Die wichtigsten Details:
- Keine Vorauswahl der Ressourcen ist erforderlich.
- Die Abrechnung erfolgt pro Sekunde unter Verwendung der höchsten Werte für die CPU- und Speicherauslastung, die in dieser Sekunde aufgezeichnet wurden, mindestens 1 Sekunde
- Es gilt eine Mindestspeicherabrechnung von 128 MB
- Die Netzwerkdatenübertragung über Kunden-ENIs wird zu EC2-Standardtarifen abgerechnet.
Browser
Das AgentCore-Browser-Tool bietet eine schnelle, sichere, Cloud-basierte Browser-Laufzeit, mit der KI-Agenten in großem Umfang mit Websites interagieren können.
Verbrauchsorientierte Preisgestaltung
Sie zahlen nur für das, was Sie nutzen, ohne dass eine Vorkonfiguration der Ressourcen erforderlich ist. CPU-Ressourcen werden Ihnen nur berechnet, wenn Ihr Tool aktiv eine Verarbeitung durchführt (nicht während I/O-Wartezeiten, wenn Sie nur auf LLM-Antworten warten). Bei Arbeitsspeicher-Ressourcen wird Ihnen nur der Speicherplatz in Rechnung gestellt, den Ihr Agent verbraucht.
Die wichtigsten Details:
- Keine Vorauswahl der Ressourcen ist erforderlich.
- Die Abrechnung erfolgt pro Sekunde, wobei das höchste Wasserzeichen der CPU- und Speicherauslastung für diese Sekunde verwendet wird, mindestens 1 Sekunde
- Es gilt eine Mindestspeicherabrechnung von 128 MB
- Die Netzwerkdatenübertragung über Kunden-ENIs wird zu EC2-Standardtarifen abgerechnet.
Code Interpreter
Das Tool AgentCore Code Interpreter ermöglicht es KI-Agenten, Code sicher in Sandbox-Umgebungen zu schreiben und auszuführen, wodurch ihre Genauigkeit verbessert und ihre Fähigkeit zur Lösung komplexer durchgängiger Aufgaben erweitert wird.
Verbrauchsorientierte Preisgestaltung
Sie zahlen nur für das, was Sie nutzen, ohne dass eine Vorkonfiguration der Ressourcen erforderlich ist. CPU-Ressourcen werden Ihnen nur berechnet, wenn Ihr Tool aktiv eine Verarbeitung durchführt (nicht während I/O-Wartezeiten, wenn Sie nur auf LLM-Antworten warten). Bei Arbeitsspeicher-Ressourcen wird Ihnen nur der Speicherplatz in Rechnung gestellt, den Ihr Agent verbraucht.
Die wichtigsten Details:
- Keine Vorauswahl der Ressourcen ist erforderlich.
- Die Abrechnung erfolgt pro Sekunde, wobei das höchste Wasserzeichen der CPU- und Speicherauslastung für diese Sekunde verwendet wird, mindestens 1 Sekunde
- Es gilt eine Mindestspeicherabrechnung von 128 MB
- Die Netzwerkdatenübertragung über Kunden-ENIs wird zu EC2-Standardtarifen abgerechnet.
Gateway
AgentCore Gateway bietet Agenten eine sichere Möglichkeit, Tools zu entdecken und zu verwenden. Außerdem können APIs, Lambda-Features und vorhandene Services einfach in agentenkompatible Tools umgewandelt werden.
Verbrauchsorientierte Preisgestaltung
Sie zahlen nur für die API-Aufrufe, die Ihre Agenten über Gateway tätigen. Die Gebühren richten sich nach der Anzahl der Tool-Vorgänge (ListTools und InvokeTool), der Suchanfragen und der Tools, die für semantische Suchfunktionen indexiert wurden.
Die wichtigsten Details:
- Keine Vorabkosten oder Mindestverpflichtungen erforderlich
- ListTools- und InvokeTool-APIs werden in Datenübertragungsschritten von 128 KB gemessen
Identity
AgentCore Identity vereinfacht die Identitäts- und Zugriffsverwaltung für Agenten und ermöglicht Ihren Agenten den sicheren Zugriff auf AWS-Ressourcen und Tools und Services von Drittanbietern im Namen von Benutzern oder von diesen selbst mit der Zustimmung eines zuvor autorisierten Benutzers.
Verbrauchsorientierte Preisgestaltung
Für Kunden, die AgentCore Identity entweder über AgentCore Runtime oder AgentCore Gateway verwenden, fallen für die Nutzung von AgentCore Identity keine zusätzlichen Gebühren an. In allen anderen Szenarien zahlen Sie nur für das, was Sie verwenden. Die Abrechnung erfolgt auf der Grundlage der Anfragen-Anzahl des Agenten an AgentCore Identity für ein OAuth-Token oder einen API-Schlüssel.
Die wichtigsten Details:
- Es gibt keine Mindestgebühren und keine Vorabverpflichtungen
- Die Abrechnung wird pro erfolgreichem OAuth-Token oder API-Schlüssel berechnet, der für die Ausführung einer Aufgabe angefordert wurde, für die eine Autorisierung für eine Nicht-AWS-Ressource erforderlich ist
- Es fallen keine zusätzlichen Kosten an, wenn Kunden AgentCore Identity über AgentCore Runtime oder AgentCore Gateway verwenden
Arbeitsspeicher
AgentCore Memory erleichtert es Entwicklern, kontextsensitive Agenten zu erstellen, da die komplexe Speicherinfrastruktur-Verwaltung entfällt und gleichzeitig die volle Kontrolle darüber besteht, woran sich der KI-Agent erinnert.
Verbrauchsorientierte Preisgestaltung
Sie zahlen nur für das, was Sie tatsächlich nutzen. Unsere Preisgestaltung ist einfach und nutzungsbasiert und richtet sich direkt danach, wie Ihre KI-Agenten Mehrwert schaffen:
- Der Preis für Kurzzeitspeicher basiert auf der Anzahl der aufgenommenen Rohereignisse, sodass Sie vorhersehbare Kosten für den Sitzungskontext haben.
- Der Preis für Langzeitspeicher basiert auf der Anzahl der pro Monat gespeicherten Speicher und der Anzahl der abgerufenen Arbeitsspeicher. Sie zahlen also nur, wenn Ihre Agenten dauerhaft Wissen speichern und verwenden.
- Um den Langzeitspeicher aus Rohereignissen zu extrahieren, können Sie zwischen integrierten Speicherstrategien wählen, die automatische Verarbeitung beinhalten, oder zwischen benutzerdefinierten Speicherstrategien, die in Ihrem Konto ausgeführt werden, indem Sie das Modell und den Prompt auswählen.
Die wichtigsten Details:
- Keine Vorauswahl der Ressourcen ist erforderlich.
- Für Kurzzeitspeicher wird die Abrechnung pro Anfrage zum Erstellen eines Ereignisses berechnet.
- Für Langzeitspeicher wird die Abrechnung pro gespeichertem Speicher pro Tag berechnet und über den Monat gemittelt.
- Für den Langzeitspeicher-Abruf wird die Abrechnung pro Speicherabruf-Anforderung berechnet.
Observability
AgentCore Observability bietet Entwicklern einen vollständigen Einblick in die Agenten-Workflows, um die Leistung von KI-Agenten in Produktionsumgebungen zu verfolgen, zu debuggen und zu überwachen.
Verbrauchsorientierte Preisgestaltung
Sie zahlen nach Bedarf für Telemetriedaten, die für Ihre Agenten generiert, gespeichert und abgefragt werden. Die Telemetriedaten werden aufgenommen und in Ihrem Amazon-CloudWatch-Konto gespeichert. Die Datenerfassung und -speicherung, die Abfragen zum Abrufen und Analyse von Informationen sowie die Maskierung sensibler oder personenbezogener Daten in Protokollen werden Ihnen in Rechnung gestellt. Preisdetails finden Sie auf der Amazon CloudWatch-Preisseite.
Preistabelle
Service
|
Type
|
Resource
|
Price
|
|||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Runtime
|
|
|
|
|||||||||
Browser-Tool
|
|
|
|
|||||||||
Code Interpreter
|
|
|
|
|||||||||
Gateway
|
|
|
|
|||||||||
Identity
|
Verbrauchsorientiert |
Token- oder API-Schlüsselanfragen für Nicht-AWS-Ressourcen |
0,010 USD pro 1 000 vom Agenten angeforderten Token oder API-Schlüsseln (Hinweis: AgentCore Identity ist für Kunden ohne zusätzliche Kosten verfügbar, wenn sie es entweder über AgentCore Runtime oder AgentCore Gateway verwenden) |
|||||||||
Arbeitsspeicher
|
|
|
|
|||||||||
Observability
|
Verbrauchsorientiert |
Protokolle, Metriken und Traces |
Wird gemäß Amazon-CloudWatch-Preisen berechnet |
*Für benutzerdefinierte Speicherextraktionsstrategien können zusätzliche Gebühren für die Modellnutzung in Ihrem Konto anfallen.
Preisbeispiele
Runtime
Beispiel: Einsatz eines Kundenservice-Agenten
Sie planen, einen Kundenservice-Agenten einzusetzen, der Benutzeranfragen per Chat und E-Mail beantwortet. Der Agent kümmert sich um Bestellprobleme, die Kontoüberprüfung und die Klärung der Richtlinien. Er verwendet Retrieval Augmented Generation (RAG), um Produktrichtlinien abzurufen, und Tools, die mit Model Context Protocol (MCP) kompatibel sind, um den Bestellstatus abzufragen und Support-Tickets zu aktualisieren. Jede Agentensitzung beinhaltet eine ausgeklügelte mehrstufige Argumentation mit einem RAG-Aufruf an einen Vektorspeicher, 2 MCP-Toolaufrufen (z. B. OrderAPI, TicketAPI) und 2 LLM-Argumentationsschritten. Sie haben Ihren Agenten auf AgentCore Runtime bereitgestellt, da Sie eine vollständige Sitzungsisoliation und die Flexibilität benötigen, innerhalb von Sekunden auf Millionen von Sitzungen zu skalieren.
Bei der Verarbeitung von 10 Mio. Benutzeranfragen pro Monat läuft jede Sitzung 60 Sekunden lang mit einer I/O-Wartezeit von 70 % (d. h. entweder man wartet auf LLM-Antworten oder Netzwerkantworten von internen APIs). Jede Agentensitzung nutzt während der aktiven Verarbeitung 1 vCPU und kontinuierlich 2 GB Arbeitsspeicher. Ihre monatlichen Kosten setzen sich wie folgt zusammen:
CPU-Kosten pro Sitzung: 18 Sekunden (angepasst an eine I/O-Wartezeit von 70 %) × 1 vCPU × (0,0895 USD/3 600) = 0,0004475 USD
Speicherkosten pro Sitzung: 60 Sekunden × 2 GB × (0,00945 USD/3 600) = 0,000315 USD
Gesamtkosten pro Sitzung: 0,0007625 USD
Gesamtsumme pro Monat: 10 Mio. Sitzungen × 0,0007625 USD = 7 625 USD
Die verbrauchsorientierte Preisgestaltung von AgentCore Runtime bedeutet, dass Sie nur für die aktive CPU-Verarbeitungszeit zahlen, nicht für I/O-Wartezeiten, was im Vergleich zu herkömmlichen Rechenoptionen zu einer hohen Kosteneffizienz führt.
Browser
Beispiel: Automatisiertes Reisebuchungssystem
Sie planen, einen KI-Agenten für Reisebuchungen einzurichten, der die vollständige Reiseplanung und Buchung über Webinteraktionen automatisiert. Ihre Implementierung erfordert die sichere Serverless-Laufzeit von AgentCore Browser, um Headless-Browser dynamisch zu verwalten, um Flüge und Hotels zu suchen, Klicks zu simulieren, Preise zu extrahieren und Buchungsformulare einzureichen. Das AgentCore-Browser-Tool bietet Funktionen auf Unternehmensniveau, darunter sitzungsisolierte Sandbox-Berechnungen und umfassende Beobachtbarkeit durch Live-Ansicht und Wiedergabe der Sitzung.
Der Agent verarbeitet 100 000 monatliche Anfragen. Jede Browsersitzung läuft 10 Minuten lang mit einer I/O-Wartezeit von 80 %. Während der aktiven Verarbeitung werden 2 vCPU und kontinuierlich 4 GB Speicher verwendet. Ihre monatlichen Kosten setzen sich wie folgt zusammen:
CPU-Kosten pro Sitzung: 120 Sekunden (angepasst an 80 % I/O-Wartezeit) × 2 vCPU × (0,0895 USD/3 600) = 0,005967 USD
Speicherkosten pro Sitzung: 600 Sekunden × 4 GB × (0,00945 USD/3 600) = 0,0063 USD
Gesamtkosten pro Sitzung: 0,012267 USD
Gesamtsumme pro Monat: 100 000 Sitzungen × 0,012267 USD = 1 226,67 USD
Code Interpreter
Beispiel: Automatisierung der Datenanalyse in natürlicher Sprache
Sie planen, einen Datenanalysten einzusetzen, der Geschäfts- und Produktteams bei Datensatzabfragen, Visualisierungen und statistischen Analysen unterstützt – alles in natürlicher Sprache. Ihr Agent generiert dynamisch Python-Code für komplexe Anfragen wie Korrelationsanalysen zwischen Seitenzugriffen und Konversionsraten und führt ihn aus. Sie nutzen AgentCore Code Interpreter, weil er isolierte Sandbox-Umgebungen bietet, die den Sicherheitsrichtlinien des Unternehmens entsprechen, vorgefertigte Ausführungslaufzeiten für mehrere Sprachen (JavaScript, TypeScript, Python) und Unterstützung großer Dateien bietet.
Der Agent verarbeitet 10 000 monatliche Anfragen mit 3 Codeausführungen pro Anfrage. Jede Ausführung dauert 2 Minuten mit einer I/O-Wartezeit von 60 %, wobei während der aktiven Verarbeitung 2 vCPU und kontinuierlich 4 GB Arbeitsspeicher verwendet werden. Ihre monatlichen Kosten setzen sich wie folgt zusammen:
CPU-Kosten pro Sitzung: 48 Sekunden (angepasst an 60 % I/O-Wartezeit) × 2 vCPU × (0,0895 USD/3 600) = 0,002387 USD
Speicherkosten pro Sitzung: 120 Sekunden × 4 GB × (0,00945/3600 USD) = 0,00126 USD
Gesamtkosten pro Sitzung: 0,003647 USD
Gesamtsumme pro Monat: 30 000 Ausführungen × 0,003647 USD = 109,40 USD
Gateway
Beispiel: Verbinden des Personalassistent-Agenten mit internen Tools
Sie planen, einen Personalassistenten für ein mittelständisches Unternehmen einzurichten, der interne Fragen zur Richtlinie, Urlaubssalden, Leistungsanmeldungen und Gehaltsabrechnungen bearbeitet. Der Agent muss auf mehrere interne Systeme (APIs für Onboarding, Leistung, Gehaltsabrechnung und Urlaubsmanagement) als Tools zugreifen, um die Benutzeranfragen zu bearbeiten. Sie haben AgentCore Gateway verwendet, um MCP-Server für 200 interne Tools zu erstellen, mit denen Ihr Agent von überall aus interagieren kann, ohne Code schreiben zu müssen. Zur Verbesserung der Genauigkeit der Toolnutzung haben Sie die Suchfunktion genutzt, um Tool-Metadaten zu indizieren und den dynamischen Abgleich von Tools beim Agentenaufruf auf der Grundlage des Interaktionskontexts zu ermöglichen.
Jede Agenteninteraktion erfordert 1 Such-API und 4 InvokeTool-API-Aufrufe. 50 Millionen monatliche Interaktionen führen zu 50 Millionen Such- und 200 Millionen InvokeTool-Aufrufen. Ihre monatlichen Kosten setzen sich wie folgt zusammen:
SearchToolIndex-Gebühren: 200 Tools × 0,02 USD pro 100 Tools = 0,04 USD
Gebühren für die Such-API: 50 Mio. USD × 25 USD = 1 250 USD
InvokeTool-API-Gebühren: 200 Mio. USD × 5 USD = 1 000 USD
Gesamtsumme pro Monat 2 250,04 USD
Identity
Beispiel: Sichere Zugriffsverwaltung für den Kundenservice-Agenten
Sie planen, einen Kundenservice-Agenten zu betreiben, der technische Teams durch Zugriff auf mehrere Tools unterstützt – Slack für Supportgespräche, Zoom zum Abrufen von Anrufprotokollen und GitHub für Problemverfolgung und Commit-Protokolle. Ihre Implementierung verwendet AgentCore Identity für sicheren, delegierten Zugriff „im Namen von“ Benutzern oder Support-Technikern. Das System ist mit bestehenden Identitätsanbietern (z. B. Okta, Microsoft Entra ID, Amazon Cognito) kompatibel und verwaltet alle Authentifizierungsmethoden von OAuth-Token bis hin zu IAM-Rollen, sodass keine benutzerdefinierte Sicherheitsinfrastruktur erforderlich ist.
Nehmen wir an, der Agent wird von 10 000 aktiven Benutzern pro Monat mit durchschnittlich 5 Interaktionen verwendet, wobei 3 Toolzugriffe pro Sitzung für jeden Benutzer und Monat erforderlich sind. Ihre monatlichen Kosten teilen sich wie folgt auf:
Gesamtzahl der angeforderten Token: 10 000 Benutzer × 5 Sitzungen × 3 Tools = 150 000 Token
Gesamtsumme pro Monat: 150 000 Anfragen × 0,010/1 000 USD = 1,50 USD
Hinweis: AgentCore Identity ist ohne zusätzliche Kosten enthalten, wenn Sie AgentCore Runtime oder Gateway verwenden.
Arbeitsspeicher
Beispiel: Implementierung eines personalisierten Coderungsassistenten
Sie planen, einen Codierungsassistenten zu entwickeln, der Softwareentwicklern beim Schreiben, Debuggen und Faktorwechsel von Code bei IDEs und Terminals hilft. Um eine personalisierte Erfahrung zu bieten, muss der Agent während einer Sitzung den Kontext beibehalten und sich die Benutzereinstellungen bei mehreren Sitzungen merken. Ihre Implementierung verwendet AgentCore Memory, um den Agenten sowohl mit einem Kurzzeitspeicher (unmittelbare Gespräche und Ereignisse) als auch mit einem Langzeitspeicher (persistentes, sitzungsübergreifendes Wissen) auszustatten.
Jedes Mal, wenn ein Benutzer mit dem Agenten interagiert (z. B. indem er einen Codeausschnitt sendet oder eine Codierungsfrage stellt), senden Sie ein Ereignis an AgentCore Memory, um es als Kurzzeitgedächtnis zu speichern. Für den Langzeitspeicher haben Sie integrierte Extraktionsstrategien konfiguriert, um Zusammenfassungen von Debugging-Sitzungen und Benutzereinstellungen sitzungsübergreifend automatisch zu extrahieren und zu speichern. Der Agent kann diese Langzeitspeicher dann abrufen, um Entwicklern eine personalisierte Erfahrung zu bieten.
Bei 100 000 monatlichen Kurzzeitspeicher-Ereignissen, 10 000 gespeicherten Langzeitspeichern und 20 000 monatlichen Arbeitsspeicherabrufen setzen sich Ihre Kosten wie folgt zusammen:
Kurzzeitspeicher: 100 000 Ereignisse × 0,25 USD/1 000 = 25 USD
Speicherung des Langzeitspeichers 10 000 Arbeitsspeicher × 0,75 USD/1 000 = 7,50 USD
Abruf des Langzeitspeichers: 20 000 Abrufe × 0,50 USD/1 000 = 10 USD
Gesamtsumme pro Monat: 42,50 USD
Hinweis: Bei benutzerdefinierten Extraktionsstrategien wären die Langzeitspeicherkosten niedriger, wenn sie 0,25 USD pro 1 000 gespeicherter Arbeitsspeicher betragen, da zusätzliche Gebühren für die Nutzung des Modells in Ihrem Konto anfallen könnten.
Observability
Preisbeispiele für AgentCore Observability finden Sie unter CloudWatch-Preise hier.
Haben Sie die gewünschten Informationen gefunden?
Ihr Beitrag hilft uns, die Qualität der Inhalte auf unseren Seiten zu verbessern.