Amazon Bedrock presenta el nivel de servicio reservado

Publicado en: 26 de nov de 2025

Amazon Bedrock presenta hoy un nuevo nivel de servicio reservado diseñado para cargas de trabajo que requieren un rendimiento predecible y una capacidad garantizada de tokens por minuto. El nivel reservado ofrece la posibilidad de reservar capacidad de computación prioritaria, manteniendo los niveles de servicio predecibles para sus aplicaciones esenciales. También incluye la flexibilidad de asignar diferentes capacidades de tokens de entrada y salida por minuto para cumplir con los requisitos exactos de su carga de trabajo y controlar los costos. Esto es particularmente valioso porque muchas cargas de trabajo tienen patrones de uso de tokens asimétricos. Por ejemplo, las tareas de resumen consumen muchos tokens de entrada pero generan menos tokens de salida, mientras que las aplicaciones de generación de contenido requieren menos entradas y más capacidad de salida. Cuando su aplicación necesita más capacidad de tokens por minuto de la que había reservado, el servicio pasa automáticamente al nivel estándar de pago por uso. De este modo, se garantiza un funcionamiento ininterrumpido. El nivel reservado tiene como objetivo un tiempo de actividad del 99,5 % para la respuesta del modelo y ya está disponible para Anthropic Claude Sonnet 4.5. Los clientes pueden reservar capacidad para una duración de 1 o 3 meses. Los clientes pagan un precio fijo por cada 1000 tokens por minuto y se les factura mensualmente.

Con el nivel de servicio reservado, Amazon Bedrock continúa ofreciendo más opciones a los clientes, ayudándoles a desarrollar, escalar e implementar aplicaciones y agentes que mejoran la productividad y las experiencias de los clientes, al tiempo que equilibran los requisitos de rendimiento y costos.

Para obtener más información sobre las regiones de AWS en las que está disponible el nivel de servicio reservado de Amazon Bedrock, consulte la documentación. Para obtener acceso al nivel reservado, póngase en contacto con su equipo de cuentas de AWS.