Überspringen zum Hauptinhalt

Amazon Bedrock AgentCore Pricing

Passen Sie AgentCore an Ihre Bedürfnisse an – kombinieren Sie Services, nutzen Sie sie unabhängig oder zusammen und zahlen Sie für das, was Sie nutzen, während Ihre KI-Initiativen wachsen.

Sie zahlen nur für das, was Sie nutzen

Amazon Bedrock AgentCore bietet flexible, verbrauchsorientierte Preise ohne Vorabverpflichtungen oder Mindestgebühren. Jeder Dienst und jede Funktion — Runtime, Gateway, Policy (Preview), Identity, Memory, Observability, Evaluations (Preview), Browser und Code Interpreter — können unabhängig oder zusammen verwendet werden, und Sie zahlen nur für das, was Sie tatsächlich nutzen. Dieser modulare Ansatz ermöglicht es Ihnen, klein anzufangen und zu skalieren, wenn Ihre Agenten-Anwendungen wachsen. 

Beginnen Sie kostenlos mit AgentCore — neue AWS-Kunden erhalten bis zu 200 USD in Form von Gutschriften für das kostenlose Kontingent. Entdecken Sie die Vorteile des AWS Free Tier und beginnen Sie noch heute mit der Entwicklung.

Hinweis: Richtlinien in AgentCore und AgentCore Evaluations werden in der Vorschauversion kostenlos angeboten. 

Dienste und Funktionen von AgentCore

Runtime

AgentCore Runtime ist eine sichere, serverlose Runtime, die speziell für die Bereitstellung und Skalierung von Agenten und Tools entwickelt wurde. Wählen Sie zwischen direkter Codebereitstellung für schnelle Iterationen oder containerbasierter Bereitstellung für maximale Kontrolle.

Sie zahlen nur für die aktiven Ressourcen, die Sie verbrauchen 
Im Gegensatz zu herkömmlichen Rechendiensten, bei denen vorab zugewiesene Ressourcen in Rechnung gestellt werden (d. h. feste Instanzgröße und Kosten pro Sekunde beim Hosten des Agenten), zahlen Sie mit AgentCore Runtime nur für den aktiven Ressourcenverbrauch. Dies führt zu erheblichen Kosteneinsparungen für Agenten-Workloads, die in der Regel 30-70 % der Zeit in I/O-Wartezeiten verbringen (Warten auf LLM-Antworten, Tool-/API-Aufrufe oder Datenbankabfragen). Bei vorab zugewiesenen Preisen würden Sie für ungenutzte CPUs während dieser Wartezeiten zahlen. Mit der aktiven, auf dem Ressourcenverbrauch basierenden Preisgestaltung in AgentCore Runtime sind I/O-Warte- und Leerlaufzeiten kostenlos, sofern kein anderer Hintergrundprozess ausgeführt wird.

Die Abrechnung basiert auf dem CPU- und Speicherverbrauch während der gesamten Sitzungsdauer und wird in Schritten pro Sekunde berechnet. CPU-Ressourcen werden Ihnen auf der Grundlage des tatsächlichen Verbrauchs in Rechnung gestellt. Wenn Ihr Agent während der I/O-Wartezeit keine CPU verbraucht, fallen keine CPU-Gebühren an. Bei Speicherressourcen wird Ihnen der maximale Speicherverbrauch bis zu dieser Sekunde in Rechnung gestellt.

Die wichtigsten Details:

  • Keine Vorauswahl der Ressourcen ist erforderlich
  • Die Abrechnung erfolgt pro Sekunde, wobei der tatsächliche CPU-Verbrauch und der maximale Speicherverbrauch bis zu dieser Sekunde verwendet werden, mit einem Minimum von 1 Sekunde
  • Sie zahlen nur für den tatsächlichen Ressourcenverbrauch während Ihrer Sitzung, der vom Start über die Initialisierung, die aktive Verarbeitung, die Leerlaufzeiten bis zum Ende der Sitzung (MicroVM Shutdown) reicht
  • Die Abrechnung beinhaltet den System-Overhead zusätzlich zur Ressourcennutzung Ihrer Anwendung
  • Es gilt eine Mindestspeicherabrechnung von 128 MB
  • Speicherkosten: Für den Einsatz von Containern ist ECR-Speicher erforderlich (separat abgerechnet). Bei der direkten Codebereitstellung wird Ihnen ab dem 27. Februar 2026 die Größe der von Ihnen bereitgestellten Code-Artefakte zu S3-Standardtarifen in Rechnung gestellt.
  • Für Netzwerkdatenübertragungen fallen die EC2-Standardtarife an


Browser

AgentCore Browser bietet eine schnelle, sichere, cloudbasierte Browser-Laufzeit, mit der Agenten in großem Umfang mit Websites interagieren können. 

Sie zahlen nur für die aktiven Ressourcen, die Sie verbrauchen
Im Gegensatz zu herkömmlichen Rechendiensten, bei denen vorab zugewiesene Ressourcen in Rechnung gestellt werden (d. h. feste Instanzgröße und Kosten pro Sekunde beim Hosten des Agenten), zahlen Sie mit AgentCore Browser nur für den aktiven Ressourcenverbrauch. Dies führt zu erheblichen Kosteneinsparungen für Agenten-Workloads, die in der Regel 30-70 % der Zeit in I/O-Wartezeiten verbringen (Warten auf LLM-Antworten, Tool-/API-Aufrufe oder Datenbankabfragen). Bei vorab zugewiesenen Preisen würden Sie für ungenutzte CPUs während dieser Wartezeiten zahlen. Mit der aktiven, auf dem Ressourcenverbrauch basierenden Preisgestaltung in AgentCore Browser sind I/O-Warte- und Leerlaufzeiten kostenlos, sofern kein anderer Hintergrundprozess ausgeführt wird.

Die Abrechnung basiert auf dem CPU- und Speicherverbrauch während der gesamten Sitzungsdauer und wird in Schritten pro Sekunde berechnet. CPU-Ressourcen werden Ihnen auf der Grundlage des tatsächlichen Verbrauchs in Rechnung gestellt. Wenn Ihr Agent während der I/O-Wartezeit keine CPU verbraucht, fallen keine CPU-Gebühren an. Bei Speicherressourcen wird Ihnen der maximale Speicherverbrauch bis zu dieser Sekunde in Rechnung gestellt.

Die wichtigsten Details:

  • Keine Vorauswahl der Ressourcen ist erforderlich
  • Die Abrechnung erfolgt pro Sekunde, wobei der tatsächliche CPU-Verbrauch und der maximale Speicherverbrauch bis zu dieser Sekunde verwendet werden, mit einem Minimum von 1 Sekunde
  • Sie zahlen nur für den tatsächlichen Ressourcenverbrauch während Ihrer Sitzung, der vom Start über die Initialisierung, die aktive Verarbeitung, die Leerlaufzeiten bis zum Ende der Sitzung (MicroVM Shutdown) reicht
  • Die Abrechnung beinhaltet den System-Overhead zusätzlich zur Ressourcennutzung Ihrer Anwendung
  • Es gilt eine Mindestspeicherabrechnung von 128 MB
  • Für Netzwerkdatenübertragungen fallen die EC2-Standardtarife an

Code Interpreter

AgentCore Code Interpreter: Ermöglicht es Agenten, Code sicher in Sandbox-Umgebungen auszuführen, wodurch ihre Genauigkeit verbessert und ihre Fähigkeit erweitert wird, komplexe End-to-End-Aufgaben zu lösen. 

Sie zahlen nur für die aktiven Ressourcen, die Sie verbrauchen
Im Gegensatz zu herkömmlichen Rechendiensten, bei denen vorab zugewiesene Ressourcen in Rechnung gestellt werden (d. h. feste Instanzgröße und Kosten pro Sekunde beim Hosten des Agenten), zahlen Sie mit AgentCore Code Interpreter nur für den aktiven Ressourcenverbrauch. Dies führt zu erheblichen Kosteneinsparungen für Agenten-Workloads, die in der Regel 30-70 % der Zeit in I/O-Wartezeiten verbringen (Warten auf LLM-Antworten, Tool-/API-Aufrufe oder Datenbankabfragen). Bei vorab zugewiesenen Preisen würden Sie für ungenutzte CPUs während dieser Wartezeiten zahlen. Mit der aktiven, auf dem Ressourcenverbrauch basierenden Preisgestaltung in AgentCore Code Interpreter sind I/O-Warte- und Leerlaufzeiten kostenlos, sofern kein anderer Hintergrundprozess ausgeführt wird.

Die Abrechnung basiert auf dem CPU- und Speicherverbrauch während der gesamten Sitzungsdauer und wird in Schritten pro Sekunde berechnet. CPU-Ressourcen werden Ihnen auf der Grundlage des tatsächlichen Verbrauchs in Rechnung gestellt. Wenn Ihr Agent während der I/O-Wartezeit keine CPU verbraucht, fallen keine CPU-Gebühren an. Bei Speicherressourcen wird Ihnen der maximale Speicherverbrauch bis zu dieser Sekunde in Rechnung gestellt.

Die wichtigsten Details:

  • Keine Vorauswahl der Ressourcen ist erforderlich
  • Die Abrechnung erfolgt pro Sekunde, wobei der tatsächliche CPU-Verbrauch und der maximale Speicherverbrauch bis zu dieser Sekunde verwendet werden, mit einem Minimum von 1 Sekunde
  • Sie zahlen nur für den tatsächlichen Ressourcenverbrauch während Ihrer Sitzung, der vom Start über die Initialisierung, die aktive Verarbeitung, die Leerlaufzeiten bis zum Ende der Sitzung (MicroVM Shutdown) reicht
  • Die Abrechnung beinhaltet den System-Overhead zusätzlich zur Ressourcennutzung Ihrer Anwendung
  • Es gilt eine Mindestspeicherabrechnung von 128 MB
  • Für Netzwerkdatenübertragungen fallen die EC2-Standardtarife an

Gateway

Amazon Bedrock AgentCore Gateway ermöglicht Agenten den sicheren Zugriff auf Tools, indem APIs und Lambda-Funktionen in agentenkompatible Tools umgewandelt und eine Verbindung zu vorhandenen MCP-Servern hergestellt werden.

Verbrauchsorientierte Preisgestaltung
Sie zahlen nur für die API-Aufrufe, die Ihre Agenten über Gateway tätigen. Die Gebühren richten sich nach der Anzahl der MCP-Operationen (wie ListTools, CallTool und Ping), Suchanfragen und Tools, die für semantische Suchfunktionen indexiert sind.

Die wichtigsten Details:

  • Keine Vorabkosten oder Mindestverpflichtungen erforderlich
  • Für Netzwerkdatenübertragungen fallen die EC2-Standardtarife an

 

Richtlinie (Vorschau)

 

Die Richtlinien in Amazon Bedrock AgentCore geben Ihnen eine umfassende Kontrolle über die Maßnahmen, die Agenten ergreifen, und tragen dazu bei, dass die Agenten innerhalb definierter Grenzen bleiben, ohne dass sie langsamer werden.

Verbrauchsorientierte Preisgestaltung

Sie zahlen nur für die Autorisierungsanfragen, die während der Agentenausführung ausgeführt werden. Jedes Mal, wenn ein Agent ein Tool über AgentCore Gateway aufruft, überprüft Policy die Aktion anhand Ihrer Regeln, um festzustellen, ob sie zulässig oder verweigert ist.

Darüber hinaus bietet Policy die Erstellung von Richtlinien in natürlicher Sprache, sodass Sie Cedar-Richtlinien mithilfe einfacher Beschreibungen in natürlicher Sprache erstellen können. Bei der Konvertierung natürlicher Sprache in Cedar Policy-Statements werden Ihnen pro 1 000 Benutzereingabe-Token berechnet, die verarbeitet werden.

Identity

AgentCore Identity vereinfacht die Identitäts- und Zugriffsverwaltung für Agenten und ermöglicht Ihren Agenten den sicheren Zugriff auf AWS-Ressourcen und Tools und Services von Drittanbietern im Namen von Benutzern oder von diesen selbst mit der Zustimmung eines zuvor autorisierten Benutzers.

Verbrauchsorientierte Preisgestaltung
Für Kunden, die AgentCore Identity entweder über AgentCore Runtime oder AgentCore Gateway verwenden, fallen für die Nutzung von AgentCore Identity keine zusätzlichen Gebühren an. In allen anderen Szenarien zahlen Sie nur für das, was Sie verwenden. Die Abrechnung erfolgt auf der Grundlage der Anfragen-Anzahl des Agenten an AgentCore Identity für ein OAuth-Token oder einen API-Schlüssel.

Die wichtigsten Details:

  • Es gibt keine Mindestgebühren und keine Vorabverpflichtungen
  • Die Abrechnung wird pro erfolgreichem OAuth-Token oder API-Schlüssel berechnet, der für die Ausführung einer Aufgabe angefordert wurde, für die eine Autorisierung für eine Nicht-AWS-Ressource erforderlich ist
  • Es fallen keine zusätzlichen Kosten an, wenn Kunden AgentCore Identity über AgentCore Runtime oder AgentCore Gateway verwenden 

Arbeitsspeicher

AgentCore Memory erleichtert es Entwicklern, kontextsensitive Agenten zu erstellen, da die komplexe Speicherinfrastruktur-Verwaltung entfällt und gleichzeitig die volle Kontrolle darüber besteht, woran sich der Agent erinnert.

Verbrauchsorientierte Preisgestaltung
Sie zahlen nur für das, was Sie tatsächlich nutzen. Unsere Preisgestaltung ist einfach und nutzungsbasiert und richtet sich direkt danach, wie Ihre Agenten Mehrwert schaffen:

  1. Der Preis für Kurzzeitspeicher richtet sich nach der Anzahl der erstellten Rohereignisse, sodass Sie vorhersehbare Kosten für den Sitzungskontext haben.
  2. Der Preis für Langzeitspeicheraufzeichnungen basiert auf der Anzahl der monatlich verarbeiteten und gespeicherten Erinnerungen und der Anzahl der Aufrufe zum Abrufen von Speicheraufzeichnungen. Sie zahlen also nur, wenn Ihre Agenten verarbeitetes Wissen speichern und verwenden.
  3. Um Langzeitspeicher aus Rohereignissen zu extrahieren, können Sie zwischen integrierten Speicherstrategien, die eine automatische Verarbeitung beinhalten, oder anpassbaren Speicherstrategien wählen, die in Ihrem Konto ausgeführt werden und bei denen Sie Modell und Prompt auswählen können.

Die wichtigsten Details:

  • Keine Vorauswahl der Ressourcen ist erforderlich.
  • Für Kurzzeitspeicher wird die Abrechnung pro Anfrage zum Erstellen eines Ereignisses berechnet
  • Für Langzeitspeicher wird die Abrechnung pro gespeichertem Speicher-Eintrag pro Tag berechnet und über den Monat gemittelt
  • Für den Langzeitspeicher-Abruf wird die Abrechnung pro Speicherabruf-Anforderung berechnet

Observability

AgentCore Observability bietet Entwicklern einen vollständigen Einblick in die Agenten-Workflows, um die Leistung von Agenten in Produktionsumgebungen zu verfolgen, zu debuggen und zu überwachen.

Verbrauchsorientierte Preisgestaltung
Sie zahlen nach Bedarf für Telemetriedaten, die für Ihre Agenten generiert, gespeichert und abgefragt werden. Die Telemetriedaten werden aufgenommen und in Ihrem Amazon-CloudWatch-Konto gespeichert. Die Datenerfassung und -speicherung, die Abfragen zum Abrufen und Analysieren von Informationen sowie die Maskierung sensibler oder personenbezogener Daten (PII) in Protokollen werden Ihnen in Rechnung gestellt. Preisdetails finden Sie auf der Amazon CloudWatch-Preisseite

Evaluationen (Vorschau)

AgentCore Evaluations hilft dabei, die Qualität der Agenten kontinuierlich auf der Grundlage des realen Verhaltens zu überprüfen. Teams können mithilfe von 13 integrierten Evaluatoren anhand gängiger Qualitätsdimensionen agentische Bewertungen durchführen oder benutzerdefinierte Evaluatoren für spezifische Geschäftsanforderungen erstellen. Die Ergebnisse werden in AgentCore Observability integriert, das von Amazon CloudWatch bereitgestellt wird, um eine einheitliche Überwachung zu ermöglichen.

Verbrauchsabhängige Preisgestaltung
Zahlen Sie nur für das, was Sie auch tatsächlich nutzen. Für integrierte Evaluatoren werden die Preise von AgentCore auf der Grundlage der Eingabe- und Ausgabetokens berechnet, die während der Bewertung verarbeitet wurden. Für benutzerdefinierte Evaluationen, die Ihre eigene LLM-Infrastruktur verwenden, zahlen Sie pro durchgeführter Bewertung, wobei die Inferenzkosten je nach verwendetem Modell separat berechnet werden.

Die wichtigsten Details:

  • Es sind keine Vorauszahlungen oder Mindestgebühren erforderlich
  • Beinhaltet CI/CD-Integration mit konfigurierbaren Qualitätsgrenzwerten
  • Produktionsüberwachung mit Stichprobenregeln und Dashboard-Aggregation
  • Kostenkontrolle durch prozentuale Stichproben, bedingte Stichproben und selektive metrische Überwachung
  • Die Kosten für die Nutzung des Modells sind für integrierte Evaluatoren enthalten — es fallen keine separaten Modellgebühren an
  • Für benutzerdefinierte Evaluierungen fallen zusätzliche Gebühren für die Modellnutzung in Ihrem Konto an

Preistabelle

Service/Capability
Type
Resource
Price
Runtime

Basierend auf aktivem Konsum

Basierend auf aktivem Konsum

CPU

Arbeitsspeicher

0,0895 USD pro vCPU-Stunde

0,00945 USD pro GB-Stunde

Browser-Tool

Basierend auf aktivem Konsum

Basierend auf aktivem Konsum

CPU

Arbeitsspeicher

0,0895 USD pro vCPU-Stunde

0,00945 USD pro GB-Stunde

Code Interpreter

Basierend auf aktivem Konsum

Basierend auf aktivem Konsum

CPU

Arbeitsspeicher

0,0895 USD pro vCPU-Stunde

0,00945 USD pro GB-Stunde

Gateway

Verbrauchsorientiert

Verbrauchsorientiert

Verbrauchsorientiert

API-Aufrufe (ListTools, InvokeTool, Ping)

Such-API

Indizierung von Tools

0,005 USD pro 1 000 Aufrufe

0,025 USD pro 1 000 Aufrufe

0,02 USD pro 100 indexierten Tools pro Monat

Identity

Verbrauchsorientiert

Token- oder API-Schlüsselanfragen für Nicht-AWS-Ressourcen

0,010 USD pro 1 000 vom Agenten angeforderten Token oder API-Schlüsseln

(Hinweis: AgentCore Identity ist für Kunden ohne zusätzliche Kosten verfügbar, wenn sie es entweder über AgentCore Runtime oder AgentCore Gateway verwenden)

Arbeitsspeicher

Verbrauchsorientiert

Verbrauchsorientiert

Verbrauchsorientiert

Kurzzeitspeicher

Speicherung des Langzeitspeichers

Abruf des Langzeitspeichers

0,25 USD pro 1 000 neue Ereignisse

Verwendung integrierter Arbeitsspeicherstrategien: 0,75 USD pro 1000 gespeicherter Arbeitsspeicher pro Monat

Bei Verwendung von integrierten Speicherstrategien mit Override oder selbstverwaltetem Speicher: 0,25 USD pro 1000 gespeicherten Speicherplätzen pro Monat*

0,50 USD pro 1000 Speicherdatensatzabrufe

Observability

Verbrauchsorientiert





 

Spans, Protokolle und Metriken

Wird gemäß Amazon-CloudWatch-Preisen berechnet

Evaluationen (Vorschau)

Verbrauchsorientiert
 

Verbrauchsorientiert
 

Integrierte Evaluatoren
 

Benutzerdefinierte Evaluatoren

0,0024 USD pro 1000 Eingabe-Token
0,012 USD pro 1000 Ausgabe-Token

1,50 USD pro 1000 Bewertungen (Gebühren für die Nutzung des Modells werden separat in Rechnung gestellt)

Richtlinie (Vorschau)

Verbrauchsorientiert

Verbrauchsorientiert

Autorisierungsanfrage

Eingabetokens verarbeitet

0,000025 USD pro Autorisierungsanfrage

0,13 USD pro 1000 Eingabe-Token

*Bei integrierten Strategien mit Override und Selbstverwaltung können zusätzliche Gebühren für die Nutzung des Modells in Ihrem Konto anfallen

Preisbeispiele

Runtime

Beispiel: Einsatz eines Kundendienstmitarbeiters im Kundenservice

Sie planen, einen Kundendienstmitarbeiter einzusetzen, der Benutzeranfragen per Chat und E-Mail beantwortet. Der Agent kümmert sich um Bestellprobleme, die Kontoüberprüfung und die Klärung der Richtlinien. Er verwendet Retrieval Augmented Generation (RAG), um Produktrichtlinien abzurufen, und Tools, die mit Model Context Protocol (MCP) kompatibel sind, um den Bestellstatus abzufragen und Support-Tickets zu aktualisieren. Jede Agentensitzung beinhaltet eine ausgeklügelte mehrstufige Argumentation mit einem RAG-Aufruf an einen Vektorspeicher, 2 MCP-Toolaufrufen (z. B. OrderAPI, TicketAPI) und 2 LLM-Argumentationsschritten. Sie haben Ihren Agenten auf AgentCore Runtime bereitgestellt, da Sie eine vollständige Sitzungsisolierung und die Flexibilität benötigen, innerhalb von Sekunden auf Tausende von Sitzungen zu skalieren.

Bei der monatlichen Verarbeitung von 10 Mio. Benutzeranfragen läuft jede Sitzung 60 Sekunden lang mit einer I/O-Wartezeit von 70 % (Warten auf LLM-Antworten und API-Aufrufe), und während der I/O läuft kein anderer Hintergrundprozess. Jede Agentensitzung nutzt während der aktiven Verarbeitung 1 vCPU. Die Speicherauslastung beginnt bei der Initialisierung bei 1 GB, steigt während der RAG-Verarbeitung auf 2 GB an und erreicht dann bei komplexen Toolaufrufen für den Rest der Sitzung einen Spitzenwert von 2,5 GB. Ihre monatlichen Kosten setzen sich wie folgt zusammen:

CPU-Kosten pro Sitzung: 18 Sekunden (nur aktive Verarbeitungszeit) × 1 vCPU × (0,0895 /3600 USD) = 0,0004475 USD
Speicherkosten pro Sitzung: 10 Sekunden × 1 GB × (0,00945/3600 USD) + 20 Sekunden × 2 GB × (0,00945/3600 USD) + 30 Sekunden × 2,5 GB × (0,00945/3600 USD) = 0,000026 USD + 0,000053 USD + 0,000197 = 0,000276 USD
Gesamtkosten pro Sitzung: 0,0007235 USD

Gesamtsumme pro Monat: 10 Mio. Sitzungen × 0,0007235 USD = 7 235 USD

Speicherkosten: Bei der containerbasierten Bereitstellung verwalten Sie den ECR-Speicher separat auf der Grundlage der veröffentlichten ECR-Raten. Wenn Sie stattdessen die direkte Codebereitstellung verwenden würden, würde der S3-Standardpreis (ab 27. Februar 2026) für Ihre Code-Artefakte gelten — für einen Agenten mit 100 MB summiert sich das auf 0,0023 USD/Monat an Speicherkosten.

Vergleich mit vorab zugewiesenen Preisen: Wenn für diesen Workload ein Service ausgeführt würde, der vorab zugewiesene Ressourcen berechnet, müssten Sie für die gesamte Dauer von 60 Sekunden für die Spitzenauslastung (2,5 GB Arbeitsspeicher, 1 vCPU) vorsorgen, was zu bis zu 3,3-mal höheren CPU-Kosten und bis zu 1,4-mal höheren Speicherkosten führen würde. Im obigen Beispiel sind die Einsparungen bei den CPU-Kosten erheblich, da der CPU-Verbrauch 62 % der gesamten Workload-Kosten ausmachte. Die verbrauchsabhängige Preisgestaltung von AgentCore Runtime berücksichtigt automatisch den Vorteil „I/O-Wartezeit ist kostenlos“ und berechnet bei der Skalierung nur die tatsächliche Speichernutzung, was im Vergleich zu herkömmlichen Rechenoptionen eine erhebliche Kosteneffizienz bietet.

Browser

Beispiel: Automatisiertes Reisebuchungssystem

Sie planen, einen Agenten für Reisebuchungen einzurichten, der die vollständige Reiseplanung und Buchung über Webinteraktionen automatisiert. Ihre Implementierung erfordert die sichere Serverless-Laufzeit von AgentCore Browser, um Headless-Browser dynamisch zu verwalten, um Flüge und Hotels zu suchen, Klicks zu simulieren, Preise zu extrahieren und Buchungsformulare einzureichen. Das AgentCore-Browser-Tool bietet Funktionen auf Unternehmensniveau, darunter sitzungsisolierte Sandbox-Berechnungen und umfassende Beobachtbarkeit durch Live-Ansicht und Wiedergabe der Sitzung.

Der Agent verarbeitet 100 000 monatliche Anfragen. Jede Browsersitzung dauert 10 Minuten mit einer I/O-Wartezeit von 80 %. Während der aktiven Verarbeitung verwendet es kontinuierlich 2 vCPU und 4 GB Speicher, und während der I/O nutzt es 0,4 vCPU und 5 GB Speicher. Ihre monatlichen Kosten setzen sich wie folgt zusammen:

CPU-Kosten pro Sitzung: 120 Sekunden (angepasst an 80 % I/O-Wartezeit) × 2 vCPU × (0,0895 USD/3 600) = 0,005967 USD
Speicherkosten pro Sitzung: 600 Sekunden × 4 GB × (0,00945 USD/3 600) = 0,0063 USD
Gesamtkosten pro Sitzung: 0,012267 USD
Gesamtsumme pro Monat: 100 000 Sitzungen × 0,012267 USD = 1 226,67 USD

Code Interpreter

Beispiel: Automatisierung der Datenanalyse in natürlicher Sprache

Sie planen, einen Datenanalysten einzusetzen, der Geschäfts- und Produktteams bei Datensatzabfragen, Visualisierungen und statistischen Analysen unterstützt – alles in natürlicher Sprache. Ihr Agent generiert dynamisch Python-Code für komplexe Anfragen wie Korrelationsanalysen zwischen Seitenzugriffen und Konversionsraten und führt ihn aus. Sie nutzen AgentCore Code Interpreter, weil er isolierte Sandbox-Umgebungen bietet, die den Sicherheitsrichtlinien des Unternehmens entsprechen, vorgefertigte Ausführungslaufzeiten für mehrere Sprachen (JavaScript, TypeScript, Python) und Unterstützung großer Dateien bietet.

Der Agent verarbeitet 10 000 monatliche Anfragen mit 3 Codeausführungen pro Anfrage. Jede Ausführung dauert 2 Minuten mit einer I/O-Wartezeit von 60 %, wobei während der aktiven Verarbeitung 2 vCPU und kontinuierlich 4 GB Arbeitsspeicher verwendet werden. Ihre monatlichen Kosten setzen sich wie folgt zusammen:

CPU-Kosten pro Sitzung: 48 Sekunden (angepasst an 60 % I/O-Wartezeit) × 2 vCPU × (0,0895 USD/3 600) = 0,002387 USD
Speicherkosten pro Sitzung: 120 Sekunden × 4 GB × (0,00945/3600 USD) = 0,00126 USD
Gesamtkosten pro Sitzung: 0,003647 USD
Gesamtsumme pro Monat: 30 000 Ausführungen × 0,003647 USD = 109,40 USD

Gateway

Beispiel: Verbinden des Personalassistent-Agenten mit internen Tools

Sie planen, einen Personalassistenten für ein mittelständisches Unternehmen einzurichten, der interne Fragen zur Richtlinie, Urlaubssalden, Leistungsanmeldungen und Gehaltsabrechnungen bearbeitet. Der Agent muss auf mehrere interne Systeme (APIs für Onboarding, Leistung, Gehaltsabrechnung und Urlaubsmanagement) als Tools zugreifen, um die Benutzeranfragen zu bearbeiten. Sie haben AgentCore Gateway verwendet, um MCP-Server für 200 interne Tools zu erstellen, mit denen Ihr Agent von überall aus interagieren kann, ohne Code schreiben zu müssen. Zur Verbesserung der Genauigkeit der Toolnutzung haben Sie die Suchfunktion genutzt, um Tool-Metadaten zu indizieren und den dynamischen Abgleich von Tools beim Agentenaufruf auf der Grundlage des Interaktionskontexts zu ermöglichen.

Jede Agenteninteraktion erfordert 1 Such-API und 4 InvokeTool-API-Aufrufe. 50 Millionen monatliche Interaktionen führen zu 50 Millionen Such- und 200 Millionen InvokeTool-Aufrufen. Ihre monatlichen Kosten setzen sich wie folgt zusammen:

SearchToolIndex-Gebühren: 200 Tools × 0,02 USD pro 100 Tools = 0,04 USD
Gebühren für die Such-API: 50 Mio. USD × 25 USD = 1 250 USD
InvokeTool-API-Gebühren: 200 Mio. USD × 5 USD = 1 000 USD
Gesamtsumme pro Monat 2 250,04 USD

Richtlinie (Vorschau)

Beispiel:

Sie planen, einen Agenten für die Automatisierung der Beschaffung zu entwickeln, der die Betriebsteams bei der Lieferantenauswahl, der Auftragserstellung und der Rechnungsgenehmigungen unterstützt. Um sicherzustellen, dass Aktionen den definierten Geschäftsregeln entsprechen, verwenden Sie Policy with AgentCore Gateway-Tools, um jede Aktion automatisch zu überprüfen, bevor sie anhand Ihrer definierten Richtlinien ausgeführt wird. Jedes Mal, wenn der Agent versucht, eine Aktion auszuführen (z. B. eine Kaufgenehmigung zu senden oder eine Zahlung zu veranlassen), fängt Gateway den Toolaufruf ab, um zu überprüfen, ob die Aktion zulässig oder verweigert ist. Nehmen wir an, der Agent bedient 100 000 Sitzungen in einem Monat und tätigt in jeder Sitzung durchschnittlich 5 Tool-Aufrufe. Wenn Sie für jeden Toolaufruf eine Autorisierungsanfrage implementieren, stellen Sie 500 000 Autorisierungsanfragen pro Monat mit einer Kostenaufschlüsselung wie folgt:


Autorisierungsanfragen = 100 000 Sitzungen x 5 Toolaufrufe/Sitzung x 1 erzwungene Richtlinie/Toolaufruf = 500 000 Autorisierungsanfragen
Monatliche Summe: 500 000 Anfragen x 0,000025 = 12,50 USD


Vor der Bereitstellung verwendet Ihr Team optional die Erstellung von Richtlinien in natürlicher Sprache, um das Onboarding und die Einrichtung von Richtlinien zu vereinfachen. Anstatt Cedar-Richtlinien manuell zu schreiben, beschreiben sie Regeln in einfacher Sprache und AgentCore wandelt sie in Cedar-Richtlinienerklärungen um. Ihnen wird eine einmalige Gebühr berechnet, die auf der Anzahl der Benutzereingabe-Token basiert, die während dieses Authoring-Schritts verarbeitet wurden. Wenn Ihr Team 10 000 Token verwenden würde, um mehrere Richtlinien zu erstellen, würden sich Ihre Kosten wie folgt belaufen:

Erstellung von Richtlinien = 20 000 Token × 0,13 USD pro 1 000 Eingabe-Token = 2,60 USD

Hinweis: Die CloudWatch-Standardtarife gelten, wenn Observability aktiviert ist.

Identity

Beispiel: Sichere Zugriffsverwaltung für den Kundenservice-Agenten

Sie planen, einen Kundendienstmitarbeiter zu betreiben, der technische Teams durch Zugriff auf mehrere Tools unterstützt – Slack für Supportgespräche, Zoom zum Abrufen von Anrufprotokollen und GitHub für Problemverfolgung und Commit-Protokolle. Ihre Implementierung verwendet AgentCore Identity für sicheren, delegierten Zugriff „im Namen von“ Benutzern oder Support-Technikern. Das System ist mit bestehenden Identitätsanbietern (z. B. Amazon Cognito, Okta, Microsoft Entra ID) kompatibel und verwaltet alle Authentifizierungsmethoden von OAuth-Token bis hin zu API-Schlüsseln, sodass keine benutzerdefinierte Sicherheitsinfrastruktur erforderlich ist. 

Nehmen wir an, der Agent wird von 10 000 aktiven Benutzern pro Monat mit durchschnittlich 5 Interaktionen verwendet, wobei 3 Toolzugriffe pro Sitzung für jeden Benutzer und Monat erforderlich sind. Ihre monatlichen Kosten teilen sich wie folgt auf:

Gesamtzahl der angeforderten Token: 10 000 Benutzer × 5 Sitzungen × 3 Tools = 150 000 Token
Gesamtsumme pro Monat: 150 000 Anfragen × 0,010/1 000 USD = 1,50 USD

Hinweis: AgentCore Identity ist ohne zusätzliche Kosten enthalten, wenn Sie AgentCore Runtime oder Gateway verwenden.

Arbeitsspeicher

Beispiel: Implementierung eines personalisierten Coderungsassistenten

Sie planen, einen Codierungsassistenten zu entwickeln, der Softwareentwicklern beim Schreiben, Debuggen und Faktorwechsel von Code bei IDEs und Terminals hilft. Um eine personalisierte Erfahrung zu bieten, muss der Agent während einer Sitzung den Kontext beibehalten und sich die Benutzereinstellungen bei mehreren Sitzungen merken. Ihre Implementierung verwendet AgentCore Memory, um den Agenten sowohl mit einem Kurzzeitspeicher (unmittelbare Gespräche und Ereignisse) als auch mit einem Langzeitspeicher (persistentes, sitzungsübergreifendes Wissen) auszustatten.

Jedes Mal, wenn ein Benutzer mit dem Agenten interagiert (z. B. indem er einen Codeausschnitt sendet oder eine Codierungsfrage stellt), senden Sie ein Ereignis an AgentCore Memory, um es als Kurzzeitgedächtnis zu speichern. Für den Langzeitspeicher haben Sie integrierte Extraktionsstrategien konfiguriert, um Zusammenfassungen von Debugging-Sitzungen und Benutzereinstellungen sitzungsübergreifend automatisch zu extrahieren und zu speichern. Der Agent kann diese Langzeitspeicher dann abrufen, um Entwicklern eine personalisierte Erfahrung zu bieten.

Bei 100 000 monatlichen Kurzzeitspeicher-Ereignissen, 10 000 gespeicherten Langzeitspeicher-Einträgen und 20 000 monatlichen Abrufen von Langzeitspeicher-Einträgen setzen sich Ihre Kosten wie folgt zusammen:

Kurzzeitspeicher: 100 000 Ereignisse × 0,25 USD/1 000 = 25 USD
Speicherung des Langzeitspeichers 10 000 Arbeitsspeicher × 0,75 USD/1 000 = 7,50 USD
Abruf des Langzeitspeichers: 20 000 Abrufe × 0,50 USD/1 000 = 10 USD
Gesamtsumme pro Monat: 42,50 USD

Hinweis: Mit integrierten Override-Extraktionsstrategien wären die langfristigen Speicherkosten niedriger und lägen bei 0,25 USD pro 1000 gespeicherten Speichern. Für die Nutzung des Modells in Ihrem Konto können jedoch zusätzliche Gebühren anfallen.

Observability

Beispiel: Finanzberatungsplattform für mehrere Agenten

Sie planen, eine umfassende Finanzberatungsplattform mit mehreren spezialisierten Agenten einzurichten, die sich mit Anlageanalysen, Portfolioanalysen und behördlichen Konformitätsprüfungen befassen. Jeder Agent führt komplexe, mehrstufige Überlegungen mit Datenbank- und Websuchanfragen, API-Aufrufen an Finanzdatenanbieter und Dokumentenanalysen durch. Die Plattform verarbeitet Millionen von Transaktionen und generiert umfangreiche Telemetriedaten, einschließlich Traces, Metriken und Logs für alle Agenteninteraktionen. Sie verwenden AgentCore Observability, um die Leistung zu überwachen, Probleme zu debuggen und die Einhaltung der Finanzvorschriften durch umfassende Audit-Trails sicherzustellen.

Ihre Plattform generiert monatlich 10 TB an Observability-Daten aus Agenteninteraktionen, API-Aufrufen und Systemereignissen. Unter der Annahme, dass es sich bei 30% der Spannweiten um Ereignisprotokolle handelt (Modellaufruf, Toolaufruf), werden ungefähr 6 TB (unter der Annahme von 2 KB an Protokolldaten pro Span-Ereignis) in die CloudWatch-Standardprotokolle geschrieben. Ihre monatlichen Kosten setzen sich wie folgt zusammen:

Monatliche Span Ingestion-Gebühren: 10 TB × 1 000 GB/TB × 0,35 USD/GB = 3 500 USD
Monatliche Gebühren für die Eventprotokollierung: 6 TB × 1 000 GB/TB × 0,50 USD/GB = 3 000 USD
Monatliche Summe: 3 500 USD + 3000 USD = 6 500 USD

*Die Standardtarife von CloudWatch gelten für alle an CloudWatch gesendeten Metriken und Logdaten, die keine Telemetrie (Standard) sind.

Evaluationen (Vorschau)

Beispiel: Qualitätsüberwachung von E-Commerce-Kundendienstmitarbeitern

Sie planen, einen Kundendienstmitarbeiter einzusetzen, der sich mit Bestellanfragen, der Bearbeitung von Rücksendungen und Produktempfehlungen für eine E-Commerce-Plattform befasst. Um eine gleichbleibende Servicequalität sicherzustellen, verwenden Sie AgentCore Evaluations, um die Leistung der Agenten in Entwicklungs- und Produktionsumgebungen zu überwachen. Ihre Implementierung verwendet 3 integrierte Evaluatoren auf Trace-Ebene (Richtigkeit, Hilfsbereitschaft und Zielerfolgsrate) sowie einen benutzerdefinierten Evaluator für geschäftsspezifische Qualitätskennzahlen.

Während der Entwicklung wertet Ihre CI/CD-Pipeline monatlich 5 000 Testinteraktionen aus. In der Produktion überwachen Sie 2 % der Live-Interaktionen anhand von Stichprobenregeln und werten monatlich 10 000 Kundengespräche aus. Jede integrierte Bewertung verarbeitet durchschnittlich 15 000 Eingabetoken (einschließlich Gesprächsverlauf, Produktkataloge und Bestelldetails) und generiert 300 Ausgangstoken für die Bewertung.

Ihre monatlichen Kosten setzen sich wie folgt zusammen:
Integrierte Evaluatoren:

  • Gesamtzahl der bewerteten Interaktionen: 15 000 (5 000 Entwicklung + 10 000 Produktion)
  • Integrierte Evaluatoren pro Interaktion: 3 (Richtigkeit, Hilfsbereitschaft, Zielerfolgsrate)
  • Gesamtbewertung: 15 000 Interaktionen × 3 Evaluatoren = 45 000 Bewertungen
  • Eingabe-Tokens: 45 000 Bewertungen × 15 000 Token = 675 Millionen Token
  • Ausgangstoken: 45 000 Bewertungen × 300 Token = 13,5 Mio. Token
  • Eingabekosten: 675 Mio. Token × 2,40/1 Mio. USD = 1 620 USD
  • Ausgabekosten: 13,5 Mio. Token × 12 00 USD/1 M = 162 USD
  • Zwischensumme der integrierten Evaluatoren: 1 782 USD

Benutzerdefinierte Bewertungen:

  • Gesamtzahl der benutzerdefinierten Bewertungen: 15 000 Interaktionen × 1 benutzerdefinierter Evaluator = 15 000 Bewertungen
  • Kosten für eine benutzerdefinierte Bewertung: 15 000 Bewertungen × 1,50 USD/1 000 = 22,50 USD

Gesamtsumme Monat: 1 804,50 USD

Hinweis: Die Kosten für die Modellnutzung sind für integrierte Evaluatoren enthalten. Für benutzerdefinierte Evaluierungen fallen zusätzliche Gebühren für die Modellnutzung in Ihrem Konto an.

I want to

Haben Sie die gewünschten Informationen gefunden?

Ihr Beitrag hilft uns, die Qualität der Inhalte auf unseren Seiten zu verbessern.