Amazon Bedrock introduit le niveau de service réservé
Amazon Bedrock présente aujourd'hui un nouveau niveau de service réservé conçu pour les charges de travail nécessitant des performances prévisibles et une capacité garantie en termes de jetons par minute. Le niveau réservé permet de réserver une capacité de calcul prioritaire, garantissant ainsi la prévisibilité des niveaux de service pour vos applications critiques. Cela inclut également la flexibilité d'allouer différentes capacités en termes de jetons d'entrée et de sortie par minute pour répondre exactement aux exigences de votre charge de travail et contrôler les coûts. Cela est particulièrement utile car de nombreuses charges de travail présentent des modèles d'utilisation de jetons asymétriques. Par exemple, les tâches de synthèse consomment de nombreux jetons d'entrée mais génèrent moins de jetons de sortie, tandis que les applications de génération de contenu nécessitent moins d'entrées et plus de sorties. Lorsque votre application a besoin d'une capacité de jetons par minute supérieure à celle que vous avez réservée, le service passe automatiquement au niveau Standard, payant à l'utilisation, ce qui garantit des opérations ininterrompues. Le niveau réservé vise une disponibilité de 99,5 % pour la réponse du modèle et est disponible dès aujourd'hui pour Anthropic Claude Sonnet 4.5. Les clients peuvent réserver une capacité pour une durée d'un ou trois mois. Les clients paient un prix fixe pour 1 000 jetons par minute et sont facturés mensuellement.
Avec le niveau de service réservé, Amazon Bedrock continue d'offrir plus de choix aux clients, en les aidant à développer, à faire évoluer et à déployer des applications et des agents qui améliorent la productivité et l'expérience client tout en équilibrant les exigences en matière de performances et de coûts.
Pour en savoir plus sur les régions AWS dans lesquelles Amazon Bedrock Reserved est disponible, consultez la documentation. Pour accéder au niveau réservé, contactez l'équipe chargée de votre compte AWS.