Amazon Bedrock ora supporta il caching dei prompt con durata di un'ora
Amazon Bedrock ora supporta un'opzione di time-to-live (TTL) di un'ora per il caching dei prompt su alcuni modelli Anthropic Claude. Con questo aggiornamento è possibile estendere la persistenza dei prefissi dei prompt memorizzati nella cache dai 5 minuti predefiniti a un'ora, migliorando l'efficienza dei costi e le prestazioni per flussi di lavoro agentici di lunga durata e conversazioni su più turni.
In precedenza i contenuti memorizzati nella cache rimanevano attivi per una finestra fissa di 5 minuti e si aggiornavano a ogni riutilizzo. Con la nuova opzione TTL di un'ora è possibile mantenere il contesto per utenti che interagiscono meno frequentemente o per agenti complessi che richiedono più tempo tra una fase e l'altra, come l'uso, il recupero e l'orchestrazione degli strumenti. Il TTL di un'ora è utile anche per sessioni più lunghe e per l'elaborazione in batch, in cui si desidera che i contenuti in cache persistano per periodi estesi.
Il caching dei prompt con TTL di un'ora è disponibile al pubblico per Claude Sonnet 4.5, Claude Haiku 4.5 e Claude Opus 4.5 di Anthropic in tutte le regioni AWS commerciali e nelle regioni AWS GovCloud (Stati Uniti) in cui sono supportati questi modelli. La cache con TTL di un'ora prevede una tariffazione diversa rispetto alla cache standard di 5 minuti. Per ulteriori informazioni, consulta la documentazione e la pagina dei prezzi di Amazon Bedrock.