Уровень Reserved в Amazon Bedrock теперь доступен для Claude Opus 4.5 и Haiku 4.5
Amazon Bedrock сегодня объявляет о расширении уровня гарантированного обслуживания (Reserved), который предназначен для рабочих нагрузок, требующих прогнозируемой производительности и гарантированного количества токенов в минуту. Уровень гарантированного обслуживания позволяет резервировать вычислительные ресурсы для обеспечения предсказуемых уровней обслуживания критически важных приложений. Он также дает возможность гибко распределять пропускную способность (количество входных и выходных токенов в минуту) в соответствии с требованиями рабочей нагрузки и контролировать затраты. Это особенно важно, поскольку у многих рабочих нагрузок асимметричные графики использования токенов. Например, задачи суммирования потребляют много входных токенов и меньше выходных, в то время как приложения для генерации контента требуют меньше входных и больше выходных токенов. Когда приложению требуется больше токенов в минуту, чем зарезервировано, сервис автоматически переходит на стандартный уровень оплаты по факту использования, обеспечивая бесперебойную работу. Уровень Reserved сегодня доступен для Anthropic Claude Opus 4.5 и Claude Haiku 4.5. Клиенты могут резервировать пропускную способность на 1 или 3 месяца. Оплата осуществляется ежемесячно по фиксированной цене за 1 тысячу токенов в минуту.
С расширением уровня обслуживания Reserved сервис Amazon Bedrock продолжает предлагать клиентам широкий выбор возможностей для разработки, масштабирования и развертывания приложений и агентов, которые повышают эффективность работы и удобство для пользователей, при этом поддерживая оптимальное соотношение между производительностью и стоимостью.
Дополнительные сведения о регионах AWS, где доступен уровень гарантированного обслуживания Amazon Bedrock, см. в документации. Чтобы получить доступ к уровню гарантированного обслуживания, обратитесь к специалистам по работе с клиентами AWS.