- Amazon Bedrock›
- AgentCore›
- Prezzi
Prezzi di Amazon Bedrock AgentCore
Adatta AgentCore alle tue esigenze: combina e abbina i servizi, usali in modo indipendente o insieme e paga solo ciò che utilizzi man mano che le tue iniziative di intelligenza artificiale crescono.
Prezzi calcolati solo in base all'uso effettivo
Amazon Bedrock AgentCore offre prezzi flessibili e basati sul consumo senza impegni anticipati o commissioni minime. Ogni servizio e funzionalità (runtime, browser, interprete di codice, gateway, policy (anteprima), identità, memoria, valutazioni (anteprima) e osservabilità) può essere utilizzato in modo indipendente o insieme agli altri e si paga solo per ciò che si utilizza. Questo approccio modulare consente di iniziare con investimenti ridotti e di scalare man mano che le applicazioni degli agenti crescono.
Inizia a usare AgentCore gratuitamente: i nuovi clienti AWS ricevono fino a 200 USD in crediti di livello gratuito. Esplora i vantaggi del piano gratuito di AWS e inizia subito a creare.
Nota: la politica in AgentCore e le valutazioni di AgentCore sono offerte gratuitamente in anteprima.
Servizi e funzionalità AgentCore
Runtime
AgentCore Runtime è un runtime sicuro e serverless creato appositamente per l'implementazione e il dimensionamento di agenti e strumenti. Scegli tra l'implementazione diretta del codice per un'iterazione rapida o l'implementazione basata su container per il massimo controllo.
Paghi solo per le risorse attive che consumi
A differenza dei servizi di elaborazione tradizionali che addebitano le risorse preallocate (ad esempio, dimensioni fisse dell'istanza e costo al secondo durante l'hosting dell'agente), con Runtime AgentCore paghi solo il consumo di risorse attive. Ciò consente un notevole risparmio sui costi per i carichi di lavoro degli agenti, che in genere trascorrono il 30-70% del tempo in attesa di I/O (in attesa di risposte LLM, chiamate tool/API o query al database). Con prezzi preallocati, pagheresti per la CPU inattiva durante questi periodi di attesa. Con i prezzi basati sul consumo di risorse attive in Runtime AgentCore, l'attesa I/O e il tempo di inattività sono gratuiti, se nessun altro processo in background è in esecuzione.
La fatturazione si basa sul consumo di CPU e memoria per tutta la durata della sessione, calcolato con incrementi al secondo. Per le risorse CPU, l'addebito viene calcolato in base al consumo effettivo: se l'agente non consuma CPU durante l'attesa I/O, non vengono addebitati costi per la CPU. Per quanto riguarda le risorse di memoria, ti viene addebitato il picco di memoria consumato fino a quel secondo.
Dettagli chiave:
- Non è richiesta una selezione anticipata delle risorse
- La fatturazione viene calcolata al secondo, utilizzando il consumo effettivo della CPU e il picco di memoria consumato fino a quel secondo, con un minimo di 1 secondo
- Paghi solo per il consumo effettivo di risorse durante la sessione, che va dall'avvio della MicroVM, all'inizializzazione, all'elaborazione attiva, ai periodi di inattività, fino alla conclusione della sessione (spegnimento della MicroVM)
- La fatturazione include il sovraccarico del sistema oltre all'utilizzo delle risorse dell'applicazione
- Si applica una fatturazione minima per 128 MB
- Costi di archiviazione: l'implementazione del container richiede lo storage ECR (fatturato separatamente). L’implementazione diretta del codice ti addebiterà la dimensione degli artefatti di codice che hai distribuito alle tariffe S3 Standard, a partire dal 27 febbraio 2026.
- Le tariffe di trasferimento dati di rete si applicano alle tariffe EC2 standard
Browser
Browser AgentCore fornisce un runtime del browser veloce, sicuro e basato su cloud per consentire agli agenti di interagire con i siti Web su larga scala.
Paghi solo per le risorse attive che consumi
A differenza dei servizi di elaborazione tradizionali che addebitano le risorse preallocate (ad esempio, dimensione fissa dell'istanza e costo al secondo durante l'hosting dell'agente), con Browser AgentCore paghi solo il consumo di risorse attive. Ciò consente un notevole risparmio sui costi per i carichi di lavoro degli agenti, che in genere trascorrono il 30-70% del tempo in attesa di I/O (in attesa di risposte LLM, chiamate tool/API o query al database). Con prezzi preallocati, pagheresti per la CPU inattiva durante questi periodi di attesa. Con i prezzi basati sul consumo di risorse attive in Browser AgentCore, l'attesa I/O e il tempo di inattività sono gratuiti, se nessun altro processo in background è in esecuzione.
La fatturazione si basa sul consumo di CPU e memoria per tutta la durata della sessione, calcolato con incrementi al secondo. Per le risorse CPU, l'addebito viene calcolato in base al consumo effettivo: se l'agente non consuma CPU durante l'attesa I/O, non vengono addebitati costi per la CPU. Per quanto riguarda le risorse di memoria, ti viene addebitato il picco di memoria consumato fino a quel secondo.
Dettagli chiave:
- Non è richiesta una selezione anticipata delle risorse
- La fatturazione viene calcolata al secondo, utilizzando il consumo effettivo della CPU e il picco di memoria consumato fino a quel secondo, con un minimo di 1 secondo
- Paghi solo per il consumo effettivo di risorse durante la sessione, che va dall'avvio della MicroVM, all'inizializzazione, all'elaborazione attiva, ai periodi di inattività, fino alla conclusione della sessione (spegnimento della MicroVM)
- La fatturazione include il sovraccarico del sistema oltre all'utilizzo delle risorse dell'applicazione
- Si applica una fatturazione minima per 128 MB
- Le tariffe di trasferimento dati di rete si applicano alle tariffe EC2 standard
Interprete di codice
Interprete di codice Agentcore: consente agli agenti di intelligenza artificiale di eseguire codice in modo sicuro in ambienti sandbox, migliorando la loro precisione ed espandendo la loro capacità di risolvere attività end-to-end complesse.
Paghi solo per le risorse attive che consumi
A differenza dei servizi di elaborazione tradizionali che addebitano le risorse preallocate (ad esempio, dimensione fissa dell'istanza e costo al secondo durante l'hosting dell'agente), con Interprete di codice AgentCore paghi solo il consumo di risorse attive. Ciò consente un notevole risparmio sui costi per i carichi di lavoro degli agenti, che in genere trascorrono il 30-70% del tempo in attesa di I/O (in attesa di risposte LLM, chiamate tool/API o query al database). Con prezzi preallocati, pagheresti per la CPU inattiva durante questi periodi di attesa. Con i prezzi basati sul consumo di risorse attive in Interprete di codice AgentCore, l'attesa I/O e il tempo di inattività sono gratuiti, se nessun altro processo in background è in esecuzione.
La fatturazione si basa sul consumo di CPU e memoria per tutta la durata della sessione, calcolato con incrementi al secondo. Per le risorse CPU, l'addebito viene calcolato in base al consumo effettivo: se l'agente non consuma CPU durante l'attesa I/O, non vengono addebitati costi per la CPU. Per quanto riguarda le risorse di memoria, ti viene addebitato il picco di memoria consumato fino a quel secondo.
Dettagli chiave:
- Non è richiesta una selezione anticipata delle risorse
- La fatturazione viene calcolata al secondo, utilizzando il consumo effettivo della CPU e il picco di memoria consumato fino a quel secondo, con un minimo di 1 secondo
- Paghi solo per il consumo effettivo di risorse durante la sessione, che va dall'avvio della MicroVM, all'inizializzazione, all'elaborazione attiva, ai periodi di inattività, fino alla conclusione della sessione (spegnimento della MicroVM)
- La fatturazione include il sovraccarico del sistema oltre all'utilizzo delle risorse dell'applicazione
- Si applica una fatturazione minima per 128 MB
- Le tariffe di trasferimento dati di rete si applicano alle tariffe EC2 standard
Gateway
Gateway Amazon Bedrock AgentCore consente agli agenti di accedere agli strumenti trasformando le API e le funzioni Lambda in strumenti compatibili con gli agenti e connettendosi ai server MCP esistenti.
Prezzi basati sul consumo
Paghi solo per le chiamate API effettuate dai tuoi agenti tramite Gateway. La tariffa viene addebitata in base al numero di operazioni MCP (come ListTools, CallTool e Ping), alle query di ricerca e agli strumenti indicizzati per la funzionalità di ricerca semantica.
Dettagli chiave:
- Non sono richiesti costi iniziali o impegni minimi
- Le tariffe di trasferimento dati di rete si applicano alle tariffe EC2 standard
Policy (anteprima)
Policy di Amazon Bedrock AgentCore ti offre un controllo completo sulle azioni intraprese dagli agenti, aiutando a garantire che gli agenti rimangano entro limiti definiti senza rallentamenti.
Prezzi basati sul consumo
Paghi solo per le richieste di autorizzazione eseguite durante l'esecuzione dell'agente. Ogni volta che un agente chiama uno strumento tramite Gateway AgentCore, Policy verifica l'azione rispetto alle regole per determinare se è consentita o negata.
Inoltre, Policy offre la creazione di policy in linguaggio naturale, che consente di creare policy Cedar utilizzando semplici descrizioni in linguaggio naturale. Ti viene addebitato ogni 1.000 token di input dell'utente elaborati durante la conversione del linguaggio naturale in dichiarazioni politiche Cedar.
Identità
Identità AgentCore semplifica la gestione delle identità e degli accessi degli agenti e consente ai tuoi agenti di accedere in modo sicuro alle risorse AWS e agli strumenti e servizi di terze parti per conto degli utenti o da soli con il consenso dell'utente pre-autorizzato.
Prezzi basati sul consumo
I clienti che utilizzano AgentCore Identity tramite AgentCore Runtime o AgentCore Gateway non devono sostenere costi aggiuntivi per l'utilizzo di AgentCore Identity. In tutti gli altri scenari, pagherai solo per ciò che utilizzi e ti verrà addebitato un costo in base al numero di richieste dall'agente ad AgentCore Identity per un token OAuth o una chiave API.
Dettagli chiave:
- Non sono previste tariffe minime né impegni anticipati.
- La fatturazione viene calcolata in base al token OAuth o alla chiave API richiesti per eseguire un'attività che richiede l'autorizzazione per una risorsa non AWS
- Nessun costo aggiuntivo, quando i clienti utilizzano Identità AgentCore tramite Runtime AgentCore o Gateway AgentCore
Memoria
Memoria AgentCore consente agli sviluppatori di creare facilmente agenti sensibili al contesto eliminando la gestione complessa dell'infrastruttura di memoria e fornendo il pieno controllo su ciò che l'agente IA ricorda.
Prezzi basati sul consumo
I prezzi sono calcolati solo in base all'uso effettivo. I nostri prezzi sono semplici e basati sull'utilizzo e si allineano direttamente al modo in cui i tuoi agenti creano valore:
- Il prezzo della memoria a breve termine viene calcolato in base al numero di eventi non elaborati acquisiti, con costi prevedibili per il contesto durante la sessione.
- Il prezzo dei record di memoria a lungo termine viene calcolato in base al numero di memorie elaborate e archiviate ogni mese e al numero di chiamate per il recupero dei record di memoria, quindi paghi solo quando i tuoi agenti archiviano e utilizzano le conoscenze elaborate.
- Per estrarre la memoria a lungo termine dagli eventi non elaborati, puoi scegliere tra strategie di memoria integrate, che includono l'elaborazione automatica, o strategie di memoria configurabili eseguite nel tuo account utilizzando la scelta del modello e del prompt.
Dettagli chiave:
- Non è richiesta una selezione anticipata delle risorse
- Per la memoria a breve termine, la fatturazione viene calcolata per richiesta di creazione di eventi
- Per l'archiviazione della memoria a lungo termine, la fatturazione viene calcolata per memoria archiviata al giorno e calcolata in media su base mensile
- Per il recupero della memoria a lungo termine, la fatturazione viene calcolata per richiesta di recupero della memoria
Osservabilità
Osservabilità AgentCore offre agli sviluppatori una visibilità completa sui flussi di lavoro degli agenti per tracciare, eseguire il debug e monitorare le prestazioni degli agenti IA negli ambienti di produzione.
Prezzi basati sul consumo
I dati di telemetria generati, archiviati e interrogati per i tuoi agenti vengono pagati in base al loro utilizzo. I dati di telemetria vengono inseriti e archiviati nel tuo account Amazon CloudWatch. L'importazione e l'archiviazione dei dati, le richieste per il recupero e l'analisi delle informazioni e il mascheramento dei dati sensibili/informazioni di identificazione personale (PII) nei log sono a carico dell'utente. Per visualizzare i dettagli dei prezzi, visita la pagina dei prezzi di Amazon CloudWatch.
Valutazioni (anteprima)
Valutazioni AgentCore aiuta a controllare continuamente la qualità degli agenti in base al comportamento del mondo reale. I team possono eseguire valutazioni agentiche utilizzando 13 valutatori integrati su dimensioni di qualità comuni o creare valutatori personalizzati per requisiti aziendali specifici. I risultati sono integrati in Osservabilità AgentCore basato su Amazon CloudWatch per un monitoraggio unificato.
Prezzi basati sul consumo
Prezzi calcolati in base all'uso effettivo. Per i valutatori integrati, il prezzo viene addebitato da AgentCore in base ai token di input e output elaborati durante la valutazione. Per le valutazioni personalizzate che utilizzano la tua infrastruttura LLM, paghi per valutazione eseguita, con costi di inferenza separati in base al modello utilizzato.
Dettagli chiave:
- Non sono previsti anticipi né tariffe minime.
- Include l'integrazione CI/CD con soglie di qualità configurabili
- Monitoraggio della produzione con regole di campionamento e aggregazione di dashboard
- Controllo dei costi tramite campionamento basato su percentuali, campionamento condizionale e monitoraggio metrico selettivo
- I costi di utilizzo del modello sono inclusi per i valutatori integrati, senza costi aggiuntivi per il modello
- Le valutazioni personalizzate comportano costi aggiuntivi per l'utilizzo del modello nel tuo account
Tabella dei prezzi
|
Service/Capability
|
Type
|
Resource
|
Price
|
|||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Runtime
|
|
|
|
|||||||||
|
Strumento browser
|
|
|
|
|||||||||
|
Interprete di codice
|
|
|
|
|||||||||
|
Gateway
|
|
|
|
|||||||||
|
Identity
|
Basato sul consumo |
Richieste di token o chiavi API per risorse non AWS |
0,010 USD per 1.000 token o chiavi API richiesti dall'agente (Nota: AgentCore Identity è disponibile senza costi aggiuntivi per i clienti quando lo utilizzano tramite AgentCore Runtime o AgentCore Gateway) |
|||||||||
|
Memory
|
|
|
|
|||||||||
|
Osservabilità
|
Basato sul consumo
|
Span, log e metriche
|
Addebitato in base ai prezzi di Amazon CloudWatch |
|||||||||
|
Valutazioni (anteprima)
|
|
|
|
|||||||||
|
Policy (anteprima)
|
|
|
|
*Per le strategie integrate con override e autogestite, potresti incorrere in costi aggiuntivi per l'utilizzo del modello nel tuo account
Esempi di prezzo
Runtime
Esempio: implementazione di un agente dell'assistenza clienti
Prevedi di implementare un agente dell'assistenza clienti che risolva le domande degli utenti tramite chat ed e-mail. L'agente gestisce i problemi relativi agli ordini, la verifica dell'account e i chiarimenti sulle policy. Utilizza la generazione aumentata di recupero (RAG) per recuperare le policy di prodotto e strumenti compatibili con il Model Context Protocol (MCP) per interrogare lo stato degli ordini e aggiornare i ticket di supporto. Ogni sessione dell'agente prevede un sofisticato ragionamento in più fasi con una chiamata RAG a un archivio vettoriale, due chiamate allo strumento MCP (ad esempio, OrderAPI, TicketAPI) e due passaggi di ragionamento LLM. Hai implementato il tuo agente su AgentCore Runtime perché hai bisogno di un completo isolamento delle sessioni e della flessibilità necessaria per scalare fino a migliaia di sessioni in pochi secondi.
Elaborando 10 milioni di richieste utente al mese, ogni sessione viene eseguita per 60 secondi con un tempo di attesa I/O del 70% (in attesa di risposte LLM e chiamate API) e nessun altro processo in background è in esecuzione durante l'I/O. Ogni sessione dell'agente utilizza 1vCPU durante l'elaborazione attiva. L'utilizzo della memoria parte da 1 GB durante l'inizializzazione, aumenta a 2 GB durante l'elaborazione RAG, quindi raggiunge il picco a 2,5 GB durante le chiamate complesse agli strumenti per il resto della sessione. I costi mensili sono suddivisi come segue:
Costo della CPU per sessione: 18 secondi (solo tempo di elaborazione attivo) × 1vCPU × (0,0895 USD/3600) = 0,0004475 USD
Costo della memoria per sessione: 10 secondi × 1 GB × (0,00945/3600 USD) + 20 secondi × 2 GB × (0,00945/3600 USD) + 30 secondi × 2,5 GB × (0,00945/3600 USD) = 0,000026 USD + 0,000053 USD + 0,000197 USD = 0,000276 USD
Costo totale per sessione: 0,0007235 USD
Totale mensile: 10 milioni di sessioni × 0,0007235 USD = 7.235 USD
Costi di archiviazione: con l'implementazione basata su container, gestisci lo storage ECR separatamente in base alle tariffe ECR pubblicate. Se invece utilizzassi l’implementazione diretta del codice, i prezzi S3 Standard (a partire dal 27 febbraio 2026) si applicherebbero agli artefatti del codice: per un agente da 100 MB, ciò equivale a 0,0023 USD al mese in costi di archiviazione.
Confronto con i prezzi preallocati: se questo carico di lavoro fosse eseguito con un servizio che addebita risorse preallocate, sarebbe necessario effettuare il provisioning per i picchi di utilizzo (2,5 GB di memoria, 1 vCPU) per l'intera durata di 60 secondi, con costi della CPU fino a 3,3 volte superiori e costi di memoria fino a 1,4 volte superiori. Nell'esempio precedente, i risparmi sui costi della CPU sono significativi, dato che il consumo di CPU ha rappresentato il 62% del costo totale del carico di lavoro. Il prezzo basato sul consumo di Runtime AgentCore coglie automaticamente il vantaggio “I/O wait is free” e addebita solo l'effettivo utilizzo della memoria man mano che aumenta, offrendo una notevole efficienza dei costi rispetto alle opzioni di elaborazione tradizionali.
Browser
Esempio: sistema automatico di prenotazione viaggi
Hai intenzione di creare un agente per la prenotazione di viaggi che automatizzi la pianificazione completa dei viaggi e la prenotazione tramite interazioni Web. L'implementazione richiede il runtime sicuro e serverless di Browser AgentCore per gestire dinamicamente i browser headless per la ricerca di voli, hotel, la simulazione di clic, l'estrazione dei prezzi e l'invio di moduli di prenotazione. Lo strumento AgentCore Browser offre funzionalità di livello aziendale, tra cui il calcolo sandbox isolato dalla sessione e l'osservabilità completa tramite Live View e Session Replay.
L'agente elabora 100.000 richieste mensili. Ogni sessione del browser viene eseguita per 10 minuti con un tempo di attesa I/O dell'80%. Durante l'elaborazione attiva utilizza continuamente 2 vCPU e 4 GB di memoria e durante l'I/O utilizza 0,4 vCPU e 5 GB di memoria. I costi mensili sono suddivisi come segue:
Costo della CPU per sessione: 120 secondi (aggiustando l'80% di attesa I/O) × 2 vCPU × (0,0895 USD/3.600) = 0,005967 USD
Costo della memoria per sessione: 600 secondi × 4 GB × (0,00945/3.600 USD) = 0,0063 USD
Costo totale per sessione: 0,012267 USD
Totale mensile: 100.000 sessioni × 0,012267 USD = 1.226,67 USD
Code Interpreter
Esempio: automazione dell'analisi dei dati in linguaggio naturale
Prevedi di implementare un agente di analisi dei dati che supporti i team aziendali e di prodotto con query, visualizzazioni e analisi statistiche sui set di dati, il tutto utilizzando il linguaggio naturale. Il tuo agente genera ed esegue dinamicamente codice Python per richieste complesse come l'analisi della correlazione tra traffico del sito e tassi di conversione. AgentCore Code Interpreter offre ambienti sandbox isolati conformi alle policy di sicurezza aziendali, runtime di esecuzione predefiniti per più linguaggi (JavaScript, TypeScript, Python) e supporto per file di grandi dimensioni.
L'agente elabora 10.000 richieste mensili con tre esecuzioni di codice per richiesta. Ogni esecuzione viene eseguita per 2 minuti con un tempo di attesa I/O del 60%, utilizzando due vCPU durante l'elaborazione attiva e 4 GB di memoria in modo continuo. I costi mensili sono suddivisi come segue:
Costo della CPU per sessione: 48 secondi (aggiustando il 60% di attesa I/O) × 2 vCPU × (0,0895 USD/3.600) = 0,002387 USD
Costo della memoria per sessione: 120 secondi × 4 GB × (0,00945/3.600 USD) = 0,00126 USD
Costo totale per sessione: 0,003647 USD
Totale mensile: 30.000 esecuzioni × 0,003647 USD = 109,40 USD
Gateway
Esempio: collegamento dell'agente HR Assistant agli strumenti interni
Hai intenzione di creare un assistente delle risorse umane per un'impresa di medie dimensioni, gestendo domande sulle politiche interne, saldi ferie, iscrizione ai benefit e richieste sui salari. Per soddisfare le richieste degli utenti, l'agente deve accedere a più sistemi interni (API di Onboarding, Benefits, Payroll e Leave Management) come strumenti. Hai utilizzato AgentCore Gateway per creare server MCP per 200 strumenti interni con cui il tuo agente può interagire da qualsiasi luogo, il tutto senza scrivere alcun codice. Per migliorare la precisione nell'uso degli strumenti, hai sfruttato la funzionalità di ricerca per indicizzare i metadati degli strumenti e abilitare la corrispondenza dinamica degli strumenti durante la chiamata dell'agente in base al contesto di interazione.
Ogni interazione con l'agente richiede una API di ricerca e quattro invocazioni API InvokeTool. 50 milioni di interazioni mensili comportano 50 milioni di chiamate Search e 200 milioni di chiamate InvokeTool. I costi mensili sono suddivisi come segue:
Costi per SearchToolIndex: 200 strumenti × 0,02 USD per 100 strumenti = 0,04 USD
Costi per l'API di ricerca: 50 milioni × 25 USD/milione = 1.250 USD
Costi per l'API InvokeTool: 200 milioni × 5 USD/milione = 1.000 dollari
Totale mensile: 2.250,04 USD
Policy (anteprima)
Esempio:
Prevedi di sviluppare un agente di automazione degli acquisti che aiuti i team operativi a gestire la selezione dei fornitori, la creazione degli ordini di acquisto e l'approvazione delle fatture. Per garantire che le azioni seguano le regole aziendali definite, utilizzi Policy con Gateway AgentCore per verificare automaticamente ogni azione prima che venga eseguita rispetto alle politiche definite. Ogni volta che l'agente tenta di eseguire un'azione (ad esempio, inviare l'approvazione dell'acquisto o avviare un pagamento), Gateway intercetta la chiamata allo strumento per verificare se l'azione è consentita o negata. Supponiamo che l'agente svolga 100.000 sessioni in un mese e effettui in media 5 chiamate allo strumento in ogni sessione. Se si implementa una richiesta di autorizzazione per ogni chiamata allo strumento, si effettuano 500.000 richieste di autorizzazione al mese con una ripartizione dei costi come segue:
Richieste di autorizzazione = 100.000 sessioni x 5 chiamate agli strumenti/sessione x 1 policy applicata/ chiamata strumento = 500.000 richieste di autorizzazione
Totale mensile: 500.000 richieste x 0,000025 = 12,50 USD
Prima dell'implementazione, il team utilizza facoltativamente la creazione di policy in linguaggio naturale per semplificare l'onboarding e l'impostazione delle politiche. Invece di scrivere manualmente le policy Cedar, descrivono le regole in un linguaggio semplice e AgentCore le converte in dichiarazioni politiche Cedar. Ti viene addebitata una commissione una tantum in base al numero di token di input dell'utente elaborati durante questa fase di creazione. Se il tuo team utilizzasse 10.000 token per creare diverse politiche, i costi sarebbero:
Creazione di policy = 20.000 token × 0,13 USD per 1.000 token di input = 2,60 USD
Nota: se Osservabilità è abilitata, si applicano le tariffe standard di CloudWatch.
Identity
Esempio: gestione sicura degli accessi all'assistenza clienti
Prevedi di utilizzare un agente dell'assistenza clienti che assista i team tecnici accedendo a più strumenti: Slack per le conversazioni di supporto, Zoom per recuperare i log delle chiamate e GitHub per il monitoraggio dei problemi e i log dei commit. La tua implementazione utilizza Identità AgentCore per un accesso sicuro e delegato degli utenti o dei tecnici dell'assistenza. Il sistema è compatibile con i provider di identità esistenti (ad esempio Okta, Microsoft Entra ID, Amazon Cognito) e gestisce tutti i metodi di autenticazione dai token OAuth alle chiavi API, eliminando la necessità di un'infrastruttura di sicurezza personalizzata.
Supponiamo che l'agente sia utilizzato da 10.000 utenti attivi mensili con una media di cinque interazioni ciascuno, che richiedono tre accessi agli strumenti per sessione per ogni utente al mese, i costi mensili sono suddivisi come segue:
Token totali richiesti: 10.000 utenti × 5 sessioni × 3 strumenti = 150.000 token
Totale mensile: 150.000 richieste × 0,010 USD/1.000 = 1,50 USD
Nota: Identità AgentCore è incluso senza costi aggiuntivi quando si utilizza Runtime AgentCore o Gateway.
Memoria
Esempio: implementazione dell'agente di assistenza alla codifica personalizzato
Prevedi di sviluppare un assistente alla codifica che aiuti gli ingegneri del software a scrivere, eseguire il debug e il refactoring del codice su IDE e terminali. Per fornire un'esperienza personalizzata, l'agente deve mantenere il contesto durante una sessione e ricordare le preferenze dell'utente in più sessioni. L'implementazione utilizza AgentCore Memory per dotare l'agente sia di memoria a breve termine (conversazioni ed eventi immediati) che di memoria a lungo termine (conoscenza persistente tra le sessioni).
Ogni volta che un utente interagisce con l'agente (ad esempio, inviando un frammento di codice o ponendo una domanda di programmazione), invii un evento ad AgentCore Memory per archiviarlo come memoria a breve termine. Per la memoria a lungo termine, hai configurato strategie di estrazione integrate per estrarre e archiviare automaticamente il riepilogo delle sessioni di debug e delle preferenze dell'utente tra le sessioni. L'agente può quindi recuperare queste memorie a lungo termine per fornire un'esperienza personalizzata agli sviluppatori.
Con 100.000 eventi di memoria a breve termine al mese, 10.000 record di memoria a lungo termine memorizzati e 20.000 chiamate di recupero dei record di memoria al mese, i costi si suddividono come segue:
Memoria a breve termine: 100.000 eventi × 0,25 USD/1.000 = 25 USD
Memoria a lungo termine: 10.000 memorie × 0,75 USD/1.000 = 7,50 USD
Recupero della memoria a lungo termine: 20.000 recuperi × 0,50 USD/1.000 = 10 USD
Totale mensile: 42,50 USD
Nota: con le strategie di estrazione integrate con override, il costo di archiviazione a lungo termine sarebbe inferiore a 0,25 USD per 1000 memorie archiviate. Tuttavia, potresti incorrere in costi aggiuntivi per l'utilizzo del modello nel tuo account.
Osservabilità
Esempio: piattaforma di consulenza finanziaria multiagente
Prevedi di implementare una piattaforma di consulenza finanziaria completa con più agenti specializzati che si occupano della ricerca sugli investimenti, dell'analisi del portafoglio e dei controlli di conformità normativa. Ogni agente esegue un ragionamento complesso in più fasi con query su database e ricerche web, chiamate API ai fornitori di dati finanziari e analisi dei documenti. La piattaforma elabora milioni di transazioni e genera dati di telemetria estesi, tra cui tracce, metriche e log su tutte le interazioni con gli agenti. Utilizzi Osservabilità AgentCore per monitorare le prestazioni, eseguire il debug dei problemi e garantire la conformità alle normative finanziarie attraverso audit trail completi.
La tua piattaforma genera 10 TB di dati di osservabilità al mese dalle interazioni degli agenti, dalle chiamate API e dagli eventi di sistema. Supponendo che il 30% degli intervalli siano log di eventi (invocazione del modello, chiamata dello strumento), circa 6 TB (supponendo 2 KB di dati di log per evento di intervallo) vengono scritti nei log standard di CloudWatch. I costi mensili sono suddivisi come segue:
Span Ingestion mensili: 10 TB × 1.000 GB/TB × 0,35 USD/GB = 3.500 USD
Costi mensili per la registrazione degli eventi: 6 TB × 1.000 GB/TB × 0,50 USD/GB = 3.000 USD
Totale mensile: 3.500 USD + 3,00 USD = 6.500 USD
* Le tariffe standard di CloudWatch verranno applicate a tutte le metriche e ai dati di log non telemetrici (standard) inviati a CloudWatch.
Valutazioni (anteprima)
Esempio: monitoraggio della qualità degli agenti del servizio clienti di e-commerce
Prevedi di impiegare un agente del servizio clienti che gestisca le richieste di ordini, l'elaborazione dei resi e i consigli sui prodotti per una piattaforma di e-commerce. Per garantire una qualità del servizio costante, utilizzate AgentCore Evaluations per monitorare le prestazioni degli agenti negli ambienti di sviluppo e produzione. L'implementazione utilizza 3 valutatori a livello di traccia integrati (correttezza, utilità e percentuale di successo degli obiettivi) più 1 valutatore personalizzato per metriche di qualità specifiche dell'azienda.
Durante lo sviluppo, la pipeline CI/CD valuta 5.000 interazioni di test al mese. In produzione, monitorate il 2% delle interazioni in tempo reale attraverso regole di campionamento, valutando 10.000 conversazioni con i clienti al mese. Ogni valutazione integrata elabora una media di 15.000 token di input (tra cui cronologia delle conversazioni, cataloghi di prodotti e dettagli degli ordini) e genera 300 token di output per il punteggio.
I costi mensili sono suddivisi come segue:
Valutatori integrati:
- Interazioni totali valutate: 15.000 (5.000 sviluppo + 10.000 produzione)
- Valutatori integrati per interazione: 3 (correttezza, disponibilità, percentuale di successo degli obiettivi)
- Valutazione totale: 15.000 interazioni × 3 valutatori = 45.000 valutazioni
- Token di input: 45.000 valutazioni × 15.000 token = 675 milioni di token
- Token di output: 45.000 valutazioni × 300 token = 13,5 milioni di token
- Costo di input: 675 milioni di token × 2,40 USD/1 milione = 1.620 USD
- Costo di produzione: 13,5 milioni di token × 12,00 USD/1 milione = 162 USD
- Subtotale dei valutatori integrati: 1.782 USD
Valutazioni personalizzate:
- Valutazioni personalizzate totali: 15.000 interazioni × 1 valutatore personalizzato = 15.000 valutazioni
- Costo di valutazione personalizzato: 15.000 valutazioni × 1,50/1.000 USD = 22,50 USD
Totale al mese: 1.804,50 USD
Nota: i costi di utilizzo del modello sono inclusi per i valutatori integrati. Le valutazioni personalizzate comportano costi aggiuntivi per l'utilizzo del modello nel tuo account.
I want to
start building with AgentCore
Hai trovato quello che cercavi?
Facci sapere la tua opinione in modo da migliorare la qualità dei contenuti delle nostre pagine