Amazon Bedrock prend désormais en charge une durée d’une heure pour une mise en cache des invites
Amazon Bedrock prend désormais en charge une option de durée de vie (TTL) d’une heure pour une mise en cache des invites de certains modèles Claude d’Anthropic. Grâce à cette mise à jour, vous pouvez étendre la persistance des préfixes d’invite mis en cache de cinq minutes par défaut à une heure, améliorant ainsi la rentabilité et les performances pour les flux de travail agentiques de longue durée et les conversations à plusieurs tours.
Auparavant, le contenu mis en cache restait actif pendant une fenêtre fixe de cinq minutes et était actualisé lorsqu’il était réutilisé. Grâce à la nouvelle option TTL d’une heure, vous pouvez maintenir le contexte pour les utilisateurs qui interagissent moins fréquemment ou pour les agents complexes qui nécessitent plus de temps entre les étapes, telles que l’utilisation des outils, la récupération et l’orchestration. Le TTL d’une heure est également utile pour les sessions plus longues et le traitement par lots lorsque vous souhaitez que le contenu mis en cache persiste pendant de longues périodes.
La mise en cache des invites TTL d’une heure est généralement disponible pour Claude Sonnet 4.5, Claude Haiku 4.5 et Claude Opus 4.5 d’Anthropic dans toutes les Régions AWS commerciales et les Régions AWS GovCloud (US) où ces modèles sont disponibles. La mémoire cache d’une heure est facturée à un tarif différent de celui de la mémoire cache standard de cinq minutes. Pour en savoir plus, consultez la documentation relative à Amazon Bedrock et la page de tarification d’Amazon Bedrock.