В Amazon Bedrock вводятся уровни сервиса вывода «Приоритетный» и «Гибкий»
Сегодня в Amazon Bedrock вводятся два новых уровня сервиса вывода для оптимизации затрат и производительности для различных рабочих нагрузок ИИ: уровень Гибкий предлагает невысокие цены для некритичных по времени выполнения задач, таких как оценка моделей и резюмирование содержимого, а уровень Приоритетный обеспечивает высокую производительность и приоритетную обработку для критически важных задач. Для большинства моделей, поддерживающих уровень «Приоритетный», клиенты могут увеличить количество исходящих токенов в секунду (OTPS) на 25 % по сравнению со стандартным уровнем. Новые уровни дополняют существующий уровень Стандартный с надежной производительностью для повседневных задач ИИ.
Эти уровни обслуживания позволяют решить ключевые проблемы, с которыми сталкиваются организации при масштабном развертывании ИИ. Уровень «Гибкий» предназначен для неинтерактивных рабочих нагрузок, допускающих большие задержки, поэтому он идеально подходит для оценки моделей, резюмирования содержимого, маркировки и аннотирования, а также для многоэтапного агентского рабочего процесса. Цены на него ниже, чем на уровень «Стандартный». В периоды высокой нагрузки запросы уровня «Гибкий» имеют более низкий приоритет по сравнению с уровнем «Стандартный». Уровень «Приоритетный» идеально подходит для критически важных приложений, взаимодействия с конечными пользователями в реальном времени и интерактивных интерфейсов, где важен стабильно быстрый отклик. В периоды высокой нагрузки запросы уровня «Приоритетный» обрабатываются в первую очередь, но цена выше по сравнению с другими уровнями обслуживания. Эти новые уровни обслуживания уже доступны для ряда ведущих базовых моделей, включая OpenAI (gpt-oss-20b, gpt-oss-120b), DeepSeek (DeepSeek V3.1), Qwen3 (Coder-480B-A35B-Instruct, Coder-30B-A3B-Instruct, 32B, Qwen3-235B-A22B-2507) и Amazon Nova (Nova Pro и Nova Premier). Благодаря этим новым вариантам клиенты Amazon Bedrock могут лучше контролировать баланс между затратами и производительностью, экономно масштабируя рабочие нагрузки ИИ и обеспечивая при этом оптимальное взаимодействие пользователей с наиболее важными приложениями.
Подробные сведения о регионах AWS, в которых доступны уровни сервиса вывода Amazon Bedrock «Приоритетный» и «Гибкий», см. в таблице регионов AWS
Подробности об уровнях обслуживания см. в нашем новостном блоге и документации.