Amazon Bedrock представляет уровень гарантированного обслуживания

Проведено: 26 нояб. 2025 г.

Сегодня Amazon Bedrock представляет новый уровень гарантированного обслуживания для рабочих нагрузок, требующих предсказуемой производительности и определенного количества токенов в минуту. Уровень гарантированного обслуживания позволяет резервировать вычислительные ресурсы для обеспечения предсказуемых уровней обслуживания критически важных приложений. Он также дает возможность гибко распределять пропускную способность (количество входных и выходных токенов в минуту) в соответствии с требованиями рабочей нагрузки и контролировать затраты. Это особенно важно, поскольку у многих рабочих нагрузок асимметричные графики использования токенов. Например, задачи суммирования потребляют много входных токенов и меньше выходных, в то время как приложения для генерации контента требуют меньше входных и больше выходных токенов. Когда приложению требуется больше токенов в минуту, чем зарезервировано, сервис автоматически переходит на стандартный уровень оплаты по факту использования, обеспечивая бесперебойную работу. В рамках уровня гарантированного обслуживания целевое время непрерывной работы для ответов модели составляет 99,5 %. Этот уровень доступен уже сегодня для Claude Sonnet 4.5 от Anthropic. Клиенты могут резервировать пропускную способность на 1 или 3 месяца. Оплата осуществляется ежемесячно по фиксированной цене за 1 тысячу токенов в минуту.

Уровень гарантированного обслуживания дополняет спектр предложений Amazon Bedrock, чтобы клиенты могли разрабатывать, масштабировать и развертывать свои приложения и агенты, повышающие эффективность работы и пользовательский опыт, удовлетворяя при этом требования как по производительности, так и по затратам.

Дополнительные сведения о регионах AWS, в которых сервис Amazon Bedrock доступен с уровнем гарантированного обслуживания, см. в документации. Чтобы получить доступ к уровню гарантированного обслуживания, обратитесь к специалистам по работе с клиентами AWS.