Amazon Bedrock

Цены на Amazon Bedrock

Обзор цен

Amazon Bedrock – это комплексная платформа для создания приложений и агентов на основе генеративного искусственного интеллекта с доступом к передовым базовым моделям, сервисам по развертыванию и эксплуатации агентов, а также инструментам для настройки, защиты и оптимизации приложений.

Amazon Bedrock предлагает гибкие варианты ценообразования для вывода моделей, позволяющие оптимизировать затраты и сбалансировать требования к скорости, масштабируемости и доступу к модели. В частности, это включает выбор тарифа по запросу с оплатой по факту использования без предварительных обязательств и пакетный режим для экономичной обработки больших объемов входных данных. AgentCore предлагает гибкое ценообразование, основанное на потреблении, без предварительных обязательств и минимальной платы. Подробнее об этом можно узнать, перейдя на страницу с ценами AgentCore.

Уровни обслуживания и импорт моделей

Стандартный уровень обеспечивает стабильную производительность при обычных темпах выполнения повседневных задач искусственного интеллекта. При стандартном уровне вы платите только за то, чем реально пользуетесь, без подписки на определенный срок. Для моделей генерации текста плата взимается за каждый обработанный входной токен и каждый сгенерированный выходной токен. Для моделей встраивания плата взимается за каждый обработанный входной токен. Каждый токен состоит из нескольких символов и определяет базовую единицу текста, которую изучает модель для понимания входных данных и подсказок пользователя. Для моделей генерации изображений плата взимается за каждое созданное изображение.

Подробнее

Приоритетный уровень – это уровень обслуживания премиум-класса, который обеспечивает преференциальное распределение вычислительных ресурсов для критически важных приложений. Стоимость этого уровня обслуживания выше, чем у стандартного. Для большинства моделей, поддерживающих приоритетный уровень, клиенты могут увеличить количество исходящих токенов в секунду (OTPS) на 25 % по сравнению со стандартным уровнем.

Подробнее

Гибкий уровень предлагает скидки по стандартным ценам для рабочих нагрузок, которые могут заменить немедленную обработку на экономичную. Идеально для несрочных рабочих нагрузок ИИ.

В пакетном режиме вы можете предоставлять набор текстовых запросов в одном входном файле и получать ответы в одном выходном файле, что позволяет получать масштабные прогнозы одновременно. Ответы обрабатываются и хранятся в корзине Amazon S3, и вы можете обращаться к ним в любое время после обработки. Amazon Bedrock представляет избранные базовые модели (FM) от ведущих поставщиков решений на базе искусственного интеллекта, таких как Anthropic, Meta, Mistral AI и Amazon, для пакетного анализа по цене на 50 % ниже по сравнению с ценами на выводы по запросу. Со списком моделей можно ознакомиться здесь.

Импорт пользовательских моделей позволяет использовать уже настроенные модели в Amazon Bedrock и задействовать эти модели так же, как и размещенные в Bedrock базовые модели – с полным управлением и без необходимости администрирования. Можно импортировать пользовательские весы для поддерживаемых архитектур моделей и обслуживать соответствующую модель в режиме по требованию. Плата за импорт собственной модели в Bedrock не взимается. После импорта модели вы сможете получить к ней доступ по запросу без необходимости выполнять какие-либо действия на плоскости управления. Плата взимается только за вывод модели в зависимости от количества копий пользовательской модели, необходимого для обработки объема логических выводов, а также продолжительности активности каждой копии модели (оплата производится за 5 минут). Копия модели – это единственный инстанс импортированной модели, готовый к обслуживанию запросов для вывода. Цена за копию модели в минуту зависит от таких факторов, как архитектура, длина контекста, регион AWS, версия вычислительного блока (поколение оборудования) и размер копии модели.

Настройка и оптимизация

Точная настройка подкрепления
Amazon Bedrock поддерживает точную настройку подкрепления, что позволяет повысить точность модели без глубокого машинного обучения или больших объемов маркированных данных. Amazon Bedrock автоматизирует рабочий процесс точной настройки подкрепления: он берет образцы запросов, генерирует ответы модели и оценивает их с помощью функции вознаграждения. Эти запросы, ответы и оценки затем используются для обучения вашей пользовательской модели с помощью итеративного рабочего процесса RFT. Счета за весь рабочий процесс оплачиваются по почасовой ставке. Можно настроить логический вывод на основе пользовательской модели, создав развертывание собственной модели по требованию. Опция вывода по запросу включает модель ценообразования на основе токенов, когда плата взимается в зависимости от количества токенов, обработанных во время вывода.

Контролируемая точная настройка
При работе с контролируемой точной настройкой в Amazon Bedrock вы можете донастроить базовую модель собственными данными, чтобы она предоставляла ответы с учетом конкретных задач и бизнес-контекста. Можно точно настраивать модели с помощью маркированных данных. При настройке модели генерации текста взимается плата за обучение модели на основе общего количества обработанных моделью токенов (количество токенов в корпусе обучающих данных, умноженное на количество эпох), а также за ежемесячное хранение модели. Эпохой называется полный цикл обработки набора данных для обучения на этапах точной настройки или непрерывного предварительного обучения.

Дистилляция моделей
С помощью дистилляции моделей Amazon Bedrock вы можете переносить знания от более крупной и мощной модели (называемой «моделью-учителем») к более компактной, быстрой и экономичной модели (называемой «моделью-учеником»), чтобы модель-ученик достигала сопоставимой производительности с моделью-учителем в рамках конкретных сценариев использования. Используя дистилляцию моделей Amazon Bedrock, вы платите только за то, что используете. Дистилляция представляет собой двухэтапный процесс: сначала с помощью модели-учителя генерируются синтетические данные, после чего модель-ученик обучается на этих данных. За генерацию синтетических данных взимается плата по запросу для выбранной модели-учителя. За донастройку модели-ученика взимается плата по тарифам для настройки модели (контролируемой точной настройки).

Для контролируемой точной настройки и дистилляции моделей вы можете настроить вывод на пользовательской модели, либо создав развертывание пользовательской модели по запросу, либо купив зарезервированную пропускную способность – в зависимости от конкретных требований к рабочей нагрузке и целевых затрат. Опция вывода по запросу включает модель ценообразования на основе токенов, когда плата взимается в зависимости от количества токенов, обработанных во время вывода. При покупке зарезервированной пропускной способности одной единицы модели для вывода предоставляется без подписки. Плата будет взиматься за количество часов, в течение которых вы используете первую единицу модели для вывода пользовательской модели. Если вам требуется пропускная способность для более чем одного элемента модели, необходимо оформить подписку на 1 или 6 месяцев.

Благодаря кэшированию текстовых запросов в Amazon Bedrock можно сохранять повторяющийся контекст между вызовами API, снижая затраты и задержки в ответах. Текстовые запросы часто содержат общий контекст или префиксы, такие как длительные диалоги из нескольких реплик, многочисленные примеры и подробные инструкции, уточняющие поведение модели. Используя существующие API Amazon Bedrock, можно указать префиксы текстовых запросов, которые необходимо кэшировать в течение пяти минут в кэше конкретного аккаунта AWS. В течение этого времени любые запросы с совпадающими префиксами получают скидку до 90 % на кэшированные токены и снижение задержки до 85 %. Цены и улучшение производительности зависят от модели и длины текстового запроса, но кэши всегда изолированы от аккаунта AWS.

Управление запросами в Amazon Bedrock ускоряет создание, тестирование и запуск текстовых запросов с помощью интуитивно понятного пользовательского интерфейса и набора API. Вы можете легко тестировать текстовые запросы и управлять их версиями, сравнивать различные варианты и запускать их в безопасной бессерверной инфраструктуре.

Оптимизация текстовых запросов в Amazon Bedrock автоматически перезаписывает текстовые запросы для повышения производительности и получения более лаконичных ответов от базовых моделей. Сервис интегрируется с инструментом управления текстовыми запросами для сравнения оригинальных и оптимизированных версий, а также управления жизненным циклом текстовых запросов. Кроме этого, можно использовать оптимизацию текстовых запросов в Bedrock Playground или напрямую через API.

Инструменты

Ограничения Amazon Bedrock – это единственная функция ответственного использования ИИ, предлагаемая крупным поставщиком облачных услуг, которая помогает создавать и настраивать меры безопасности, конфиденциальности и достоверности для приложений генеративного искусственного интеллекта. Он оценивает вводимые пользователем данные и ответы модели на основе политик, специфичных для конкретного случая использования, обеспечивая дополнительный уровень защиты сверх того, что доступно по умолчанию. Ограничения можно применять к моделям, размещенным на Amazon Bedrock, или к моделям любых сторонних производителей (например, OpenAI и Google Gemini) через API ApplyGuardrail. Вы также можете использовать ограничения с агентской платформой, такой как Strands Agents, включая агенты, развернутые с помощью Amazon Bedrock AgentCore. Ограничения помогают отфильтровать галлюцинации и повысить точность фактических данных за счет контекстной проверки содержимого RAG и проверки автоматизированных рассуждений для получения достоверных ответов.

Базы знаний Amazon Bedrock – это полностью управляемый рабочий процесс генерации, дополненной извлеченными данными (RAG), с помощью которого клиенты могут создавать высокоточные и безопасные настраиваемые приложения на базе генеративного искусственного интеллекта, обладающие низкой задержкой и использующие контекстную информацию из собственных источников данных. Этот инструмент поддерживает различные источники данных, включая S3, Confluence, Salesforce и SharePoint, в ознакомительной версии. Он также предлагает загрузку документов для потоковой передачи данных. Базы знаний Bedrock преобразуют неструктурированные данные во встраивания, сохраняют их в векторных базах данных и позволяют извлекать данные из различных хранилищ данных. Они также интегрируются с Kendra для управляемого извлечения данных и поддерживают извлечение структурированных данных с использованием естественного языка в SQL.

Автоматизация данных Amazon Bedrock преобразует неструктурированный мультимодальный контент в структурированные форматы данных для таких случаев использования, как интеллектуальная обработка документов, анализ видео и RAG. Автоматизация данных Bedrock может создавать стандартный вывод с использованием предопределенных значений по умолчанию, специфичных для модальности, таких как покадровые описания видео, аудиотранскрипты или автоматический анализ документов. Кроме того, заказчики могут создавать собственные выходные данные, указав свои требования к выходным данным в шаблонах на основе своей схемы данных, которую затем можно легко загрузить в существующую базу или хранилище данных. Благодаря интеграции с базами знаний автоматизацию обработки данных Bedrock также можно использовать для анализа контента приложений RAG, повышая точность и релевантность результатов за счет включения информации, встроенной в изображения и текст.

Потоки в Amazon Bedrock – это функция Bedrock для создания и выполнения рабочих процессов в приложениях с генеративным ИИ. Это ускоряет создание, тестирование и развертывание пользовательских рабочих процессов генеративного ИИ с помощью удобного визуального конструктора и набора API. Эта функция позволяет легко связывать новейшие базовые модели, текстовые запросы, агенты, базу знаний, ограничения и сервисы AWS (такие как Amazon Lex, AWS Lambda, Amazon S3) с бизнес-логикой для создания рабочих процессов генеративного ИИ. Можно легко тестировать и создавать версии рабочих процессов, а также запускать их в безопасной бессерверной среде с помощью визуального интерфейса или API без необходимости создавать собственную инфраструктуру.

Оценка модели: при оценке модели в Amazon Bedrock вы платите только за то, чем пользуетесь, без обязательств по объему текстовых запросов или ответов. При автоматической (программной) оценке вы платите только за вывод выбранной модели. Автоматически сгенерированные алгоритмические оценки предоставляются без дополнительной оплаты. При автоматической оценке (модель или LLM-как-эксперт) вы платите только за вывод выбранной генерирующей и оценивающей модели. В задании по оценке модели по методу LLM-как-эксперт встроенные метрики используют системные оценочные шаблоны текстовых запросов, уникальные для каждой метрики, а также имеющуюся оценочную модель, плата за которую будет взиматься в рамках платежей за используемые вами токены. Для обеспечения прозрачности оценочные текстовые запросы включены в общедоступную документацию по AWS. В случае оценки с участием человека (собственной рабочей команды) с вас взимается плата за вывод модели и плата в размере 0,21 USD за каждую выполненную человеком задачу. Задачей для человека считается каждое событие, в котором сотрудник вручную оценивает один запрос и связанные с ним ответы модели, используя пользовательский интерфейс оценки с участием человека. Цена за задачу будет одинаковой независимо от того, используете ли вы в задании по оценке одну или две модели. Также она не зависит от количества выбранных параметров и методов оценки. Плата за выполнение задач для человека будет указана в разделе Amazon SageMaker вашего счета AWS и одинакова для всех регионов AWS. Отдельная плата за работу сотрудников не взимается, так как персонал вы предоставляете самостоятельно. Если во время задания по оценке вместо вызова модели Bedrock вы используете функцию «предоставить свои ответы модели», с вас взимается плата только за вывод оценивающей модели (задания LLM-как-эксперт) или 0,21 USD за выполненную человеком задачу (задания по оценке с участием человека). Цены на оценку под управлением AWS назначаются в частном порядке в соответствии с вашими потребностями по оценке, с привлечением группы экспертов AWS по оценке.

Оценка RAG: при оценке RAG в Amazon Bedrock вы платите только за то, чем пользуетесь, без обязательств по объему текстовых запросов или ответов. При оценке базы знаний в Amazon Bedrock вы платите только за вывод выбранной генерирующей и оценивающей модели (в задании по оценке используется метод LLM-как-эксперт), а также оплачиваете расходы, связанные с использованием базы знаний в задании оценки, в соответствии с ценами на базы знаний Amazon Bedrock. При использовании функции «предоставить свои ответы модели» плата взимается только за вывод оценивающей модели. В задании по оценке RAG встроенные метрики используют системные оценочные шаблоны текстовых запросов, уникальные для каждой метрики, а также имеющуюся оценивающую модель, плата за которую будет взиматься в рамках платежей за используемые вами токены. Для обеспечения прозрачности оценочные текстовые запросы включены в общедоступную документацию по AWS. Некоторые метрики предусматривают вывод оценивающей модели на основе контекста, полученного из вашей базы знаний или системы RAG, либо эталонных ответов в дополнение ко входному текстовому запросу. Это влияет на стоимость каждой метрики. Дополнительная информация о каждой метрике приведена в общедоступной документации AWS по оценке.

Сведения о ценах на модели

Цены зависят от формы предоставления, поставщика и модели. Выберите поставщика модели, чтобы увидеть подробные цены.

Amazon Bedrock представляет избранные базовые модели (FM) от ведущих поставщиков решений на базе искусственного интеллекта, таких как Anthropic, Meta, Mistral AI и Amazon, для пакетного анализа по цене на 50 % ниже по сравнению с ценами на выводы по запросу. См. список моделей здесь.

AI21 Labs
AI21 Labs

Цены по требованию
Amazon
- Amazon Nova
- Amazon Titan
- Другие модели Amazon
- Amazon Nova
- Amazon Nova
  
  Цены на модели понимания
  
  Межрегиональный вывод
  
  Географический, внутрирегиональный и межрегиональный вывод
  
  Встроенные инструменты
  
  Цены на модели генерации креативного контента
  
  Цены на модели распознавания и генерации речи
  
  Цены по требованию на базовые модели преобразования речи в речь
  
  Примечание. * Цены на ввод и вывод текстовых токенов применимы к конкретным вариантам использования, таким как преобразование речи в текст, вызовы инструментов для выполнения задач или получения информации, добавление истории разговоров в сеанс и т. д.
  
  Стоимость вывода по запросу для пользовательских моделей Nova такая же, как и для базовой модели Nova.
  
  Цены на модели встраивания
- Amazon Titan
- Amazon Titan
- Другие модели Amazon
Anthropic

Anthropic

Цены по требованию и за пакет

Модели с расширенным доступом

Поставщик	Название модели	Регионы	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов	Цена за 1000 входящих токенов (пакет)	Цена за 1000 исходящих токенов (пакет)	Цена за 1000 входящих токенов (запись кэша)	Цена за 1000 входящих токенов (чтение кэша)
Anthropic	Claude 3.5 Sonnet (расширенный публичный доступ, с 1 декабря 2025 г.)	Восток США (Северная Вирджиния), Восток США (Огайо), Запад США (Орегон), Европа (Франкфурт), Европа (Ирландия), Европа (Цюрих), Европа (Париж)	0,006 USD	0,03 USD	0,003 USD	0,015 USD	Н/П	н/п
Anthropic	Claude 3.5 Sonnet v2 (расширенный публичный доступ, с 1 декабря 2025 г.)	Восток США (Северная Вирджиния), Восток США (Огайо), Запад США (Орегон)	0,006 USD	0,03 USD	0,003 USD	0,015 USD	0,0075 USD	0,0006 USD

Вывод с оптимизированными показателями задержки

Оплата за выделенную пропускную способность

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Модели Anthropic	Цена за час работы за модель без подписки	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Регион: Азиатско-Тихоокеанский регион (Токио)

Модели Anthropic	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Claude Instant	53,00 USD	29,00 USD
Claude 2.0/2.1	86,00 USD	48,00 USD

Регион: Европа (Франкфурт)

Модели Anthropic	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Claude Instant	49,00 USD	27,00 USD
Claude 2.0/2.1	79,00 USD	44,00 USD

Обратитесь к команде по работе с клиентами AWS для получения более подробной информации об элементах модели.

Cohere

Cohere

Цены по требованию

Модели Cohere	Цена за 1000 запросов**
Rerank 3.5	2,00 USD
** С вас взимается плата за количество запросов, в каждом из которых может содержаться до 100 фрагментов документа. Если запрос содержит более 100 фрагментов документа, он засчитывается как несколько запросов. Например, если запрос содержит 350 документов, он будет обработан как 4 запроса. Обратите внимание, что каждый документ может содержать не более 500 токенов (включая запрос и общее количество токенов документа), а если длина токена превышает 512 токенов, он разбивается на несколько документов.

Цены на настройку (точную)

* Общее количество обученных токенов = количество токенов в корпусе обучающих данных Х количество эпох

Оплата за выделенную пропускную способность

Модели Cohere	Цена за час работы за модель без подписки	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command – Light	8,56 USD	6,85 USD	4,11 USD
Embed 3 (на английском языке)	7,12 USD	6,76 USD	6,41 USD
Embed 3 (многоязычная версия)	7,12 USD	6,76 USD	6,41 USD

Чтобы получить более подробную информацию о моделях, перейдите на свой аккаунт AWS или обратитесь в отдел продаж.

DeepSeek
DeepSeek

Цены по требованию
Google

Google

Цены по требованию

Регионы: Восток США (Северная Вирджиния), Восток США (Огайо) и Запад США (Орегон)

Модели Google	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Gemma 3 4B	0,00004 USD	0,00008 USD
Gemma 3 12B	0,00009 USD	0,00029 USD
Gemma 3 27B	0,00023 USD	0,00038 USD

Регионы: Азиатско-Тихоокеанский регион (Мумбаи), Европа (Ирландия) и Европа (Милан)

Модели Google	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Gemma 3 4B	0,00005 USD	0,00009 USD
Gemma 3 12B	0,00011 USD	0,00034 USD
Gemma 3 27B	0,00027 USD	0,00045 USD

Регионы: Южная Америка (Сан-Паулу) и Азиатско-Тихоокеанский регион (Токио)

Модели Google	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Gemma 3 4B	0,00005 USD	0,00010 USD
Gemma 3 12B	0,00011 USD	0,00035 USD
Gemma 3 27B	0,00028 USD	0,00046 USD

Регион: Европа (Лондон)

Модели Google	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Gemma 3 4B	0,00006 USD	0,00012 USD
Gemma 3 12B	0,00014 USD	0,00045 USD
Gemma 3 27B	0,00036 USD	0,00059 USD

* Стоимость приоритетного уровня на 75 % выше, чем стандартного
* Цены на гибком уровне на 50 % ниже, чем на стандартном

Kimi AI

Kimi AI

Цены по требованию

Регионы: Восток США (Северная Вирджиния), Восток США (Огайо) и Запад США (Орегон)

Модели Kimi	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Kimi K2 Thinking	0,00060 USD	0,00250 USD

Регион: Азиатско-Тихоокеанский (Мумбаи)

Модели Kimi	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Kimi K2 Thinking	0,00071 USD	0,00294 USD

Регионы: Южная Америка (Сан-Паулу) и Азиатско-Тихоокеанский регион (Токио)

Модели Kimi	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Kimi K2 Thinking	0,00073 USD	0,00303 USD

Luma AI
Цены по требованию
Meta

MiniMax AI

Цены по требованию

Регионы: Восток США (Северная Вирджиния), Восток США (Огайо) и Запад США (Орегон)

Модели Minimax	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Minimax M2	0,00030 USD	0,00120 USD

Регионы: Азиатско-Тихоокеанский регион (Мумбаи), Европа (Ирландия) и Европа (Милан)

Модели Minimax	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Minimax M2	0,00035 USD	0,00141 USD

Регионы: Южная Америка (Сан-Паулу) и Азиатско-Тихоокеанский регион (Токио)

Модели Minimax	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Minimax M2	0,00036 USD	0,00145 USD

Регион: Европа (Лондон)

Модели Minimax	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Minimax M2	0,00047 USD	0,00186 USD

Mistral AI

Mistral AI

Цены по требованию

Регионы: Восток США (Северная Вирджиния), Восток США (Огайо) и Запад США (Орегон)

Модели Mistral	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Magistral Small 1.2	0,00050 USD	0,00150 USD
Voxtral Mini 1.0	0,00004 USD	0,00004 USD
Voxtral Small 1.0	0,00010 USD	0,00030 USD
Ministral 3B 3.0	0,00010 USD	0,00010 USD
Ministral 8B 3.0	0,00015 USD	0,00015 USD
Ministral 14B 3.0	0,00020 USD	0,00020 USD
Mistral Large 3	0,00050 USD	0,00150 USD

Регионы: Азиатско-Тихоокеанский (Мумбаи)

Модели Mistral	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Magistral Small 1.2	0,00059 USD	0,00176 USD
Voxtral Mini 1.0	0,00005 USD	0,00005 USD
Voxtral Small 1.0	0,00012 USD	0,00035 USD
Ministral 3B 3.0	0,00012 USD	0,00012 USD
Ministral 8B 3.0	0,00018 USD	0,00018 USD
Ministral 14B 3.0	0,00024 USD	0,00024 USD
Mistral Large 3	0,00059 USD	0,00176 USD

Регионы: Южная Америка (Сан-Паулу) и Азиатско-Тихоокеанский регион (Токио)

Модели Mistral	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Magistral Small 1.2	0,00061 USD	0,00182 USD
Voxtral Mini 1.0	0,00005 USD	0,00005 USD
Voxtral Small 1.0	0,00012 USD	0,00036 USD
Ministral 3B 3.0	0,00012 USD	0,00012 USD
Ministral 8B 3.0	0,00018 USD	0,00018 USD
Ministral 14B 3.0	0,00024 USD	0,00024 USD
Mistral Large 3	0,00061 USD	0,00182 USD

Регионы: Европа (Ирландия) и Европа (Милан)

Модели Mistral	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Magistral Small 1.2	0,00059 USD	0,00176 USD
Voxtral Mini 1.0	0,00005 USD	0,00005 USD
Voxtral Small 1.0	0,00012 USD	0,00035 USD
Ministral 3B 3.0	0,00012 USD	0,00012 USD
Ministral 8B 3.0	0,00018 USD	0,00018 USD
Ministral 14B 3.0	0,00024 USD	0,00024 USD

Регион: Европа (Лондон)

Модели Mistral	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Magistral Small 1.2	0,00078 USD	0,00233 USD
Voxtral Mini 1.0	0,00006 USD	0,00006 USD
Voxtral Small 1.0	0,00016 USD	0,00047 USD
Ministral 3B 3.0	0,00016 USD	0,00016 USD
Ministral 8B 3.0	0,00023 USD	0,00023 USD
Ministral 14B 3.0	0,00031 USD	0,00031 USD

NVIDIA

NVIDIA

Цены по требованию

Регионы: Восток США (Северная Вирджиния), Восток США (Огайо) и Запад США (Орегон)

Модели NVIDIA	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
NVIDIA Nemotron Nano 2	0,00006 USD	0,00023 USD
NVIDIA Nemotron Nano 2 VL	0,00020 USD	0,00060 USD

Регионы: Азиатско-Тихоокеанский регион (Мумбаи), Европа (Ирландия) и Европа (Милан)

Модели NVIDIA	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
NVIDIA Nemotron Nano 2	0,00007 USD	0,00027 USD
NVIDIA Nemotron Nano 2 VL	0,00024 USD	0,00071 USD

Регионы: Южная Америка (Сан-Паулу) и Азиатско-Тихоокеанский регион (Токио)

Модели NVIDIA	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
NVIDIA Nemotron Nano 2	0,00007 USD	0,00028 USD
NVIDIA Nemotron Nano 2 VL	0,00024 USD	0,00073 USD

Регион: Европа (Лондон)

Модели NVIDIA	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
NVIDIA Nemotron Nano 2	0,00009 USD	0,00036 USD
NVIDIA Nemotron Nano 2 VL	0,00031 USD	0,00093 USD

OpenAI

OpenAI

Цены по требованию

Регионы: Восток США (Северная Вирджиния), Восток США (Огайо) и Запад США (Орегон)

Модели OpenAI	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
GPT OSS Safeguard 20B	0,00007 USD	0,00020 USD
GPT OSS Safeguard 120B	0,00015 USD	0,00060 USD

Регионы: Азиатско-Тихоокеанский регион (Мумбаи), Южная Америка (Сан-Паулу) и Азиатско-Тихоокеанский регион (Токио)

Модели OpenAI	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
GPT OSS Safeguard 20B	0,00008 USD	0,00024 USD
GPT OSS Safeguard 120B	0,00018 USD	0,00071 USD

Регионы: Европа (Ирландия) и Европа (Милан)

Модели OpenAI	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
GPT OSS Safeguard 20B	0,00008 USD	0,00023 USD
GPT OSS Safeguard 120B	0,00018 USD	0,00070 USD

Регион: Европа (Лондон)

Модели OpenAI	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
GPT OSS Safeguard 20B	0,00011 USD	0,00031 USD
GPT OSS Safeguard 120B	0,00023 USD	0,00093 USD

TwelveLabs
TwelveLabs

Цены по требованию
Stability AI

Stability AI

Цены по требованию

Ранее сгенерированные модели изображений, предлагаемые Stability AI, оплачиваются за количество изображений с учетом количества шагов и разрешения изображения.

Регион: Орегон, Северная Вирджиния, Огайо

Службы обработки изображений Stability AI	Цена за поколение для каждой модели
Stable Image: удаление фона	0,07 USD
Stable Image: удаление объекта	0,07 USD
Stable Image: управление с помощью структуры	0,07 USD
Stable Image: управление с помощью эскиза	0,07 USD
Stable Image: руководство по стилю	0,07 USD
Stable Image: поиск и замена	0,07 USD
Stable Image: восстановление изображений	0,07 USD
Stable Image: поиск и перекрашивание	0,07 USD
Stable Image: перенос стиля	0,08 USD
Stable Image: консервативное масштабирование	0,40 USD
Stable Image: творческое масштабирование	0,60 USD
Stable Image: быстрое масштабирование	0,03 USD
Stable Image: расширение	0,06 USD

Writer

Writer

Цены на ресурсы по требованию

Модели Writer	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Palmyra X4	0,0025 USD	0,010 USD
Palmyra X5	0,0006 USD	0,006 USD

Qwen

Amazon Bedrock

Qwen

Цены по требованию

Регионы: Восток США (Северная Вирджиния), Восток США (Огайо) и Запад США (Орегон)

Модели Qwen	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Qwen3 Next 80B A3B	0,00015 USD	0,00120 USD
Qwen3 VL 235B A22B	0,00053 USD	0,00266 USD

Регионы: Азиатско-Тихоокеанский регион (Мумбаи), Европа (Ирландия) и Европа (Милан)

Модели Qwen	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Qwen3 Next 80B A3B	0,00018 USD	0,00141 USD
Qwen3 VL 235B A22B	0,00062 USD	0,00313 USD

Регионы: Южная Америка (Сан-Паулу) и Азиатско-Тихоокеанский регион (Токио)

Модели Qwen	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Qwen3 Next 80B A3B	0,00018 USD	0,00145 USD
Qwen3 VL 235B A22B	0,00064 USD	0,00322 USD

Регион: Европа (Лондон)

Модели Qwen	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Qwen3 Next 80B A3B	0,00023 USD	0,00186 USD
Qwen3 VL 235B A22B	0,00082 USD	0,00412 USD

Импорт пользовательских моделей

Импорт пользовательских моделей

Llama

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,05718 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

Регион: Европа (Франкфурт)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,07144 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

Примечание. Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Llama 3.1 8B 128 КБ требуются 2 пользовательских модельных блока, а для модели Llama 3.1 70B 128k – 8 специальных моделей.

* Оплата выставляется в течение 5 минут.

Llama мультимодальная

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,05718 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

Регион: Европа (Франкфурт)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,07144 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

* Оплата выставляется в течение 5 минут.

Mistral

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,05718 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

Регион: Европа (Франкфурт)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,07144 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

* Оплата выставляется в течение 5 минут.

Mixtral

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,05718 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

Регион: Европа (Франкфурт)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,07144 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

* Оплата выставляется в течение 5 минут.

Flan

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,05718 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

Регион: Европа (Франкфурт)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,07144 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

* Оплата выставляется в течение 5 минут.

Цены на инференсы по запросу
Счет выставляется в течение 5 минут, пока копия модели активна, начиная с первого успешного вызова. Максимальный предел пропускной способности и параллелизма для каждой копии модели определяется в процессе ее импорта и зависит от таких факторов, как сочетание токенов ввода/вывода, тип оборудования, размер модели, архитектура, оптимизация логических выводов.

Bedrock автоматически масштабирует количество копий модели в зависимости от особенностей использования. Если в течение 5 минут вызова не будет, Bedrock уменьшит масштаб до нуля и снова увеличит его при вызове модели. Во время повторного масштабирования может возникнуть продолжительность холодного запуска (в десятках секунд) в зависимости от размера модели. Bedrock также увеличивает количество копий модели, если объем вывода постоянно превышает пределы параллелизма одной копии модели. Примечание. По умолчанию на каждую импортированную модель приходится не более 3 копий модели на один аккаунт, которые можно увеличить с помощью Квоты на обслуживание.

Qwen

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,05718 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

Регион: Европа (Франкфурт)

Версия пользовательского модельного блока	версия 1.0
Цена за единицу пользовательской модели в минуту*	0,07144 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

* Оплата выставляется в течение 5 минут.

OpenAI

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	Версия 2.0
Цена за единицу пользовательской модели в минуту*	0,1433 USD
Ежемесячная стоимость хранения за единицу пользовательской модели	1,95 USD

* Оплата выставляется в течение 5 минут.

Инструменты и сведения о ценах на оптимизацию

Потоки

Потоки Amazon Bedrock

Плата зависит от количества переходов между узлами, необходимых для выполнения приложения. Bedrock Flows учитывает переход узла при каждом его выполнении в вашем рабочем процессе. Стоимость зависит от суммарного количества переходов между узлами во всех ваших потоках.

Все расходы оцениваются ежедневно, и плата за них взимается ежемесячно начиная с 1 февраля 2025 года.

Цена за 1000 переходов узлов
0,035 USD

Дополнительная плата

Если в рабочем процессе приложения используются другие сервисы AWS или осуществляется передача данных, может начисляться дополнительная плата. Например, если ваш рабочий процесс использует политику «Ограничения» для Amazon Bedrock, вам будет выставлен счет за количество текстовых единиц, обработанных политикой.

Базы знаний
Извлечение структурированных данных (посредством генерации SQL-запросов)

Оплата за извлечение структурированных данных производится на основании каждого запроса на генерацию SQL-запроса. Сгенерированный SQL-запрос используется для извлечения структурированных данных из хранилищ.

Модели Rerank

Модели Rerank предназначены для повышения релевантности и точности ответов в приложениях дополненной извлеченными данными генерации (RAG). Они оплачиваются за каждый запрос.

** С вас взимается плата за количество запросов, в каждом из которых может содержаться до 100 фрагментов документа. Если запрос содержит более 100 фрагментов документа, он засчитывается как несколько запросов. Например, если запрос содержит 350 документов, он будет обработан как 4 запроса. Обратите внимание, что каждый документ может содержать не более 512 токенов (включая запрос и общее количество токенов документа), а если длина токена превышает 512 токенов, он разбивается на несколько документов. Запрос эквивалентен единице поиска.
Ограничения

Ограничения для Amazon Bedrock

Цены на ограничения Amazon Bedrock основаны на стоимости фильтра, используемого в ограничении. Цены одинаковы как для стандартного, так и для классического уровня.

Фильтр для ограничений*	Цена
Фильтры контента как для стандартного, так и для классического уровня (текстовый контент)	0,15 USD за 1000 текстовых единиц
Фильтры контента (содержимое изображений)	0,00075 USD за каждое обработанное изображение
Запрещенные темы как для стандартного, так и для классического уровня	0,15 USD за 1000 текстовых единиц
Фильтры конфиденциальной информации	0,10 USD за 1000 текстовых единиц
Фильтры конфиденциальной информации (регулярное выражение)	Бесплатно
Фильтры слов	Бесплатно
Контекстные проверки обоснования	0,10 USD за 1000 текстовых единиц
Проверки автоматизированных рассуждений	0,17 USD за 1000 текстовых единиц на политику автоматизированных рассуждений

Цены по требованию

* Каждый фильтр ограничения опционален и может быть активирован в зависимости от требований вашего приложения. Плата будет взиматься в зависимости от типа фильтра, используемого в ограничении. Например, если ограничение настроено с использованием фильтров контента и запрещенных тем, плата за эти два фильтра будет взиматься, а за фильтры конфиденциальной информации – нет.

Примечание. Текстовая единица может содержать до 1000 символов. Если текстовый ввод превышает 1000 символов, он обрабатывается как несколько текстовых единиц, каждая из которых содержит 1000 символов или меньше. Например, если введенный текст содержит 5600 символов, плата будет взиматься за 6 текстовых единиц.

Контекстная проверка обоснования использует источник данных и запрос, чтобы определить степень соответствия ответа модели источнику данных и запросу. Общее количество текстовых единиц, за которые взимается плата, рассчитывается путем объединения всех символов в источнике, запросе и ответе модели.

Оценка модели

Оценка модели

За оценку модели взимается плата за вывод, сделанный на основе выбранной модели. Автоматически сгенерированные алгоритмические оценки предоставляются без дополнительной оплаты. В случае оценки с участием человека (собственной рабочей команды) с вас взимается плата за вывод модели и плата в размере 0,21 USD за каждую выполненную человеком задачу.

Модель

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Стоимость выполнения каждой задачи для человека

Модель, выбранная для оценки

На основе выбранной модели

0,21 USD

Автоматизация обработки данных
Автоматизация обработки данных

Базы знаний Amazon Bedrock обеспечивают интеграцию автоматизации обработки данных Bedrock для получения более релевантных и точных ответов на мультимодальные данные. При настройке базы знаний можно выбрать в качестве метода синтаксического анализа автоматизацию обработки данных Bedrock для анализа и извлечения значимой информации из изображений или документов, включая рисунки, схемы и диаграммы. Во время обработки эта функция извлекает значимую информацию из полученных документов и изображений, которая затем используется на последующих этапах базы знаний для группировки, встраивания и хранения. При интеграции с базами знаний она обеспечивает стандартизированный выход и взимает соответствующую плату.
Интеллектуальная маршрутизация запросов

Ценовой уровень	Ценообразование	Тарифный план
Интеллектуальная маршрутизация запросов	1 USD за 1000 запросов	По требованию

Интеллектуальная маршрутизация запросов

Интеллектуальная маршрутизация запросов позволяет применять комбинацию базовых моделей (FM) из одного семейства моделей для оптимизации качества и затрат. Например, используя семейство моделей Anthropic Claude, Amazon Bedrock может интеллектуально маршрутизировать запросы между Claude 3.5 Sonnet и Claude 3 Haiku в зависимости от сложности запроса. Аналогичным образом Amazon Bedrock может направлять запросы между Meta Llama 3.3, 70B и 3.18B, а также между Nova Pro и Nova Lite. Маршрутизатор запросов предсказывает, какая модель обеспечит наилучшую производительность для каждого запроса, а также поможет оптимизировать качество ответа и затраты. Это особенно полезно для таких приложений, как помощники по обслуживанию клиентов, где простые запросы можно обрабатывать с помощью небольших, быстрых и экономичных моделей, а сложные – перенаправить в более эффективные модели. Интеллектуальная маршрутизация запросов позволяет сократить расходы на 30 % без ущерба для точности.

Оптимизация текстовых запросов

Оптимизация текстового запроса для Amazon Bedrock

Плата взимается в зависимости от количества токенов во входных и оптимизированных текстовых запросах.

Все платежи осуществляются ежемесячно, начиная с 23 апреля 2025 года.

Цена за 1000 токенов

0,030 USD

Примеры расчета цен

AI21 Labs

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Jurassic-2 Mid от AI21 Labs для суммирования вводного потока из 10 000 токенов входного текста в итоговый поток из 2000 токенов.

Общая стоимость = 10 000 токенов / 1000 * 0,0125 USD + 2000 токенов / 1000 * 0,0125 USD = 0,15 USD
Amazon

Цены по требованию

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Amazon Titan Text Lite для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,0003 USD + 1000 токенов / 1000 * 0,0004 USD = 0,001 USD.

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к базовой модели генератора изображений Amazon Titan для создания 1000 изображений размером 1024 × 1024 в стандартном качестве.

Общая стоимость = 1000 изображений * 0,01 USD за изображение = 10 USD

Оплата за настройку (тонкую настройку и непрерывное предварительное обучение)

Разработчик приложения настраивает модель генератора изображений Amazon Titan, используя 1000 пар «изображение – текст». После обучения разработчик использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

Ежемесячные затраты на тонкую настройку вычисляются так: обучение для тонкой настройки (0,005 USD * 500 * 64), где 0,005 USD – цена за просмотренное изображение, 500 – количество шагов, 64 – размер партии плюс хранение пользовательской модели в месяц (1,95 USD) + 1 час анализа пользовательской модели (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает два элемента модели Amazon Titan Text Express с подпиской на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц: 2 элемента модели * 18,40 USD/час * 24 часа * 31 день = 27 379,20 USD

Разработчик приложения покупает один элемент модели базовой модели генератора изображений Amazon Titan с подпиской на один месяц.

Общая стоимость = 1 элемент модели * 16,20 USD * 24 часа * 31 день = 12 052,80 USD
Ограничения для Amazon Bedrock
Пример 1. Чат-бот службы поддержки
Разработчик приложения создает чат-бота службы поддержки клиентов и использует фильтры контента для блокировки вредоносного контента и запрещенных тем, чтобы отфильтровывать нежелательные запросы и ответы.

Чат-бот обрабатывает 1000 запросов пользователей в час. Каждый пользовательский запрос имеет среднюю длину ввода 200 символов и получает ответ базовой модели размером в 1500 символов.

Каждый пользовательский запрос длиной 200 символов соответствует одной текстовой единице.

Каждый ответ базовой модели длиной 1500 символов соответствует двум текстовым единицам.

Текстовые единицы, обрабатываемые каждый час = (1 + 2) * 1000 запросов = 3000 текстовых единиц

Общая стоимость часов фильтрации контента и запрещенных тем = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

Пример 2. Обобщение стенограмм колл-центра
Разработчик создает приложение для обобщения стенограмм чатов между пользователями и агентами поддержки. Он использует фильтр конфиденциальной информации для редактирования информации, позволяющей установить личность (PII), в сгенерированных сводках по 10 000 разговоров.

Каждая сгенерированная сводка содержит в среднем 3500 символов, что соответствует 4 текстовым единицам.

Общая стоимость суммирования: 10 000 разговоров = 10 000 * 4 * (0,1 USD / 1000) = 4 USD
Пример 3. Механизм верификации медицинских протоколов
Компания в сфере медицинских технологий внедряет проверки автоматизированных рассуждений в свою систему поддержки клинических решений, чтобы проверять предложенные варианты лечения на соответствие медицинским рекомендациям.

Система обрабатывает 5000 клинических случаев в месяц. Каждый случай включает в себя:
- Сводка данных о пациенте: 500 символов (1 текстовая единица)
- Диагностическая оценка: 2000 символов (2 текстовых единицы)
- Рекомендация по лечению: 4500 символов (5 текстовых единиц)
Количество обрабатываемых текстовых единиц в месяц = (1 + 2 + 5) 5000 случаев = 40 000 текстовых единиц
Общая ежемесячная стоимость проверок автоматизированных рассуждений = 40 000 (0,17 USD) /1000 = 6,80 USD
Базы знаний Amazon Bedrock

Пример расчета стоимости 1 (изменение ранжирования с использованием модели Amazon Rerank 1.0)

Предположим, что в течение месяца вы отправляете 2 миллиона запросов в API Rerank с использованием модели Amazon Rerank 1.0. В каждом из первого миллиона запросов содержится менее 100 документов, поэтому плата за них взимается как за один запрос. Оставшийся 1 миллион запросов содержит 120–150 документов, поэтому за каждый запрос будет взиматься плата как за 2 запроса.

Цена за один запрос = 0,001 USD
Общая стоимость = 1 000 000 * 0,001 USD + 1 000 000 * 2 * 0,001 USD = 3000 USD

Пример расчета стоимости 2 (получение структурированных данных)

Разработчик приложения создает чат-бота поддержки, который запрашивает структурированные данные, хранящиеся в Amazon Redshift. Затем он создает базу знаний Bedrock и подключается к Amazon Redshift. Чат-бот за час обрабатывает 10 000 пользовательских запросов. Каждый пользовательский запрос будет стоить 0,002 USD за API GenerateQuery для генерации SQL на основе пользовательского запроса.

Общая стоимость генерации SQL в час = 0,002 USD * 10 000 = 20 USD
Общая стоимость за месяц = 20 USD * 24 * 30 = 1440 USD
Anthropic

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock в регионе Запад США (Орегон): запрос к модели Claude от Anthropic для суммирования входящего потока из 11 000 токенов входящего текста в исходящий поток размером 4000 токенов.

Общая стоимость = 11 000 токенов / 1000 * 0,008 USD + 4000 токенов / 1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Anthropic Claude Instant в регионе Запад США (Орегон).

Общая стоимость в месяц = 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD
Cohere

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.

Общая стоимость = 6000 токенов / 1000 * 0,0015 USD + 2000 токенов / 1000 * 0,0020 USD = 0,013 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command – Light от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.

Общая стоимость = 6000 токенов / 1000 * 0,0003 USD + 2000 токенов / 1000 * 0,0006 USD = 0,003 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Embed English или Embed Multilingual от Cohere, чтобы создавать вложения для 10 000 токенов входящего потока.

Общая стоимость = 10 000 токенов / 1000 * 0,0001 USD = 0,001 USD

Оплата за настройку (тонкую настройку)

Разработчик приложения настраивает командную модель Cohere, используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,004 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода по пользовательской модели (49,50 USD). Итого: 55,45 USD.

Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 39,60 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Cohere Command с подпиской на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц = 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD
Импорт пользовательских моделей

Пример ценообразования. Разработчик приложения импортирует персонализированную модель типа Llama 3.1 с параметром 8B и длиной последовательности 128 КБ в регионе us-east-1 и удаляет модель через 1 месяц. Для этого необходимы 2 элемента нестандартной модели. Таким образом, цена за минуту составит 0,1570 USD, поскольку требуются 2 элемента пользовательской модели. Стоимость хранения двух моделей на заказ составит 3,90 USD в месяц.

Плата за импорт модели не взимается. Первый успешный вызов осуществлен в 08:03. В это время начинается замер. Окна измерений длительностью 5 минут работают с 08:03 до 08:07, с 08:07 до 08:11 и т. д. Если за любой 5-минутный период был выполнен хотя бы один вызов, окно оплаты будет считаться активным. Если вызов поступит в 08:03, а после 08:07 больше вызовов не будет, отсчет остановится в 08:07. В этом случае счет будет рассчитан следующим образом: 0,1570 USD * 5 минут * 1 окно по пять минут = 0,785 USD.
Автоматизация обработки данных

Пример расчета стоимости 1.
Допустим, вы обрабатываете документ на 1000 страниц с помощью BDA Custom Output. Все 1000 страниц обрабатываются с использованием чертежа 1, состоящего из 15 полей. Цена за обработку одной страницы с использованием любого чертежа с 30 полями или меньше составляет 0,040 USD. Общая стоимость составит 40 USD.

Общее количество обработанных страниц: 1000
Цена за обработку одной страницы с использованием чертежей, содержащих менее 30 полей = 0,040 USD
Общая стоимость = 1000 страниц * 0,040 USD = 40 USD

Пример расчета стоимости 2.
Допустим, вы обрабатываете 2 документа с помощью BDA Custom Output. Документ 1 содержит 40 страниц и обрабатывается с использованием чертежа 1, состоящего из 20 полей. Документ 2 содержит 10 страниц и обрабатывается с использованием чертежа 2, состоящего из 40 полей. Цена за обработку одной страницы с использованием чертежа 1 составляет 0,040 USD, поскольку он содержит 30 полей или меньше. Цена за обработку одной страницы с использованием чертежа 2 составляет 0,045 USD. Стоимость обработки документа 1 с использованием чертежа 1 составляет 1,60 USD. Стоимость обработки документа 2 с использованием чертежа 2 составляет 0,45 USD. Общая стоимость обработки обоих документов составит 2,05 USD.

Общее количество обработанных страниц = 50
Цена за обработку одной страницы с использованием чертежа 1, содержащего меньше 30 полей = 0,040 USD
Цена за обработку одной страницы с использованием чертежа 2, содержащего 40 полей = 0,040 USD + (количество дополнительных полей свыше 30 * 0,0005 USD за поле)
Количество дополнительных полей свыше 30 = 40 - 30 = 10
Цена за обработку одной страницы с использованием чертежа 2, содержащего 40 полей = 0,040 USD + (10 * 0,0005 USD за поле) = 0,045 USD
Стоимость обработки документа 1 с использованием чертежа 1 = 40 страниц x 0,040 USD за страницу = 1,6 USD
Стоимость обработки документа 2 с использованием чертежа 2 = 10 страниц x 0,045 USD за страницу = 0,45 USD
Общая стоимость = плата за документ 1 + плата за документ 2 = 1,6 USD + 0,45 USD = 2,05 USD

Пример расчета стоимости 3.
Допустим, вы настроили базы знаний Bedrock для использования Bedrock Data Automation в качестве синтаксического анализатора, а затем загрузили документ объемом 1000 страниц. Обратите внимание, что структуры затрат различаются в зависимости от вариантов синтаксического анализа баз знаний. BDA использует цену за страницу, в то время как синтаксические анализаторы базовой модели взимают плату в зависимости от токенов ввода и вывода. Ориентировочная информация: для обработки 1000 страниц, где 30 % содержат таблицы, а 30 % – рисунки, обычно требуется 2900 входных токенов и 750 выходных токенов. Использование токенов зависит от типа контента, поэтому клиентам рекомендуется проводить тестирование, применяя свои собственные данные, чтобы получить более точные оценки. В интеграции баз знаний Bedrock и Bedrock Data Automation используется стандартный выход, в этом случае цена за страницу составляет 0,010 USD. Общая стоимость составит 10 USD.

Общее количество обработанных страниц: 1000
Цена за страницу для стандартного выхода = 0,010 USD
Общая стоимость = 1000 * 0,010 USD = 10 USD

Пример расчета стоимости 4.
Допустим, вы обрабатываете 60-минутное видео с помощью BDA Standard Output. Стоимость минуты стандартного видеовыхода составляет 0,050 USD. Общая стоимость составит 3,00 USD.

Общее количество обработанных минут = 60
Стоимость минуты стандартного видеовыхода = 0,050 USD
Общая стоимость = 60 * 0,050 USD = 3,00 USD

Пример расчета стоимости 5.
Допустим, вы обрабатываете 2000 изображений с помощью BDA Custom Output. Первая 1000 изображений обрабатывается с использованием чертежа 1, состоящего из 10 полей. Вторая 1000 страниц обрабатывается с использованием чертежа 2, состоящего из 40 полей. Цена за обработку одного изображения с использованием чертежа 1 составляет 0,005 USD, поскольку он содержит 30 полей или меньше. Цена за обработку одного изображения с использованием чертежа 2 составляет 0,01 USD. Стоимость обработки первой 1000 изображений с использованием чертежа 1 составляет 5,00 USD. Стоимость обработки второй 1000 изображений с использованием чертежа 2 составляет 10,00 USD. Общая стоимость обработки 2000 изображений составит 15,00 USD

Стоимость первой 1000 изображений = 1000 изображений * 0,005 USD за изображение = 5,00 USD
Стоимость второй 1000 изображений = 1000 изображений * (0,005 USD + (количество дополнительных полей свыше 30 * 0,0005 USD за поле))
= 1000 * (0,005 USD + ((40-30) * 0,0005 USD))
= 1000 * (0,005 USD + (10 * 0,0005 USD)) = 10,00 USD
Общая стоимость = 5,00 USD + 10,00 USD = 15,00 USD

Пример расчета стоимости 6.
Предположим, вы хотите использовать Bedrock Data Automation Standard Output для обработки аудиозаписей совещаний вашей организации продолжительностью 15 000 минут. Общая стоимость обработки всех 15 000 минут аудиозаписей составит 90 USD.

Общее количество обработанных минут = 15 000 минут
Общая стоимость = 15 000 минут × 0,006 USD = 90 USD
DeepSeek

Цены по требованию

Каждый час разработчик приложения выполняет следующие вызовы API в Amazon Bedrock: запрос к модели DeepSeek-R1 с просьбой суммировать ввод 2000 токенов входного текста и 1000 токенов (включая токены рассуждения).

Общая стоимость в час = 2000 токенов / 1000 * 0,00135 USD + 1000 токенов / 1000 * 0,0054 USD = 0,0081 USD
Рабочие процессы

Пример. Сводка новостей
Разработчик приложения создает поток с целью автоматизации суммирования новостей для трейдеров. Поток начинается с узла ввода, определяющего местоположение S3, далее узел загрузки S3 извлекает 10 файлов со статьями от 10 ведущих информационных агентств (2 перехода). Затем узел-итератор вызывает модель суммирования файлов с помощью узла текстового запроса (+ 10 файлов x 2 перехода). Полученные результаты собираются узлом-коллектором, затем сохраняются обратно в S3 через узел S3-хранилища и передаются в узел Output для завершения процесса (+ 3 перехода). Поток запускается каждые полчаса в рабочие дни.

Количество переходов между узлами для выполнения одного потока: 2+1+10 * 2 + 3 = 25 переходов.

Количество запусков потока в месяц: 24 часа * 2 запуска в час * 5 дней * 4 недели = 960 запусков.

Общая ежемесячная стоимость: 25 * 960 * 0,035 USD / 1000 = 0,84 USD

Дополнительные расходы
Дополнительно в счет будут включены расходы на сервисы AWS, используемые в процессе выполнения потока, включая хранение и извлечение данных через Amazon S3 (узлы загрузки и хранения) и применение базовой модели Amazon Bedrock (узел текстового запроса).
Meta

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Llama 2 Chat (13 млрд) от Meta для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток размером 500 токенов.

Общая стоимость = 2000 токенов / 1000 * 0,00075 USD + 500 токенов / 1000 USD * 0,001 USD = 0,002 USD

Оплата за настройку (тонкую настройку)

Разработчик приложения настраивает предварительно обученную модель Llama 2 (70 млрд), используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,00799 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода по пользовательской модели (23,50 USD). Итого: 33,44 USD.

Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 21,18 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Meta Llama 2 с подпиской на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц = 1 элемент модели * 21,18 USD * 24 часа * 31 день = 15 757,92 USD
Mistral AI

Цены по требованию

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mistral 7B для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,00015 USD + 1000 токенов / 1000 * 0,0002 USD = 0,0005 USD

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mixtral 8x7B для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,00045 USD + 1000 токенов / 1000 * 0,0007 USD = 0,0016 USD

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mistral Large для суммирования входящего потока размером 2000 токенов входящего текста в исходящий поток размером 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,008 USD + 1000 токенов / 1000 * 0,024 USD = 0,04 USD

Оценка модели

Оценка модели, пример 1.

Этот набор данных содержит 50 запросов, а для оценки каждого сочетания запроса и ответа разработчик требует использовать 1-го сотрудника (это значение указывается в параметре «количество сотрудников на запрос» при создании задания по оценке).

В этом оценочном задании будет 50 задач (по 1 заданию на каждый набор подсказок и ответов на каждого работника). 50 запросов в сумме содержат 5000 входящих токенов, а ответы – 15 тысяч токенов для Anthropic Claude Instant и 20 тысяч токенов для Anthropic Claude 2.1.

Плата за эту работу по оценке модели вычисляется следующим образом:

Элемент	Количество входящих токенов	Цена за 1000 входящих токенов	Стоимость входящих потоков	Количество исходящих токенов	Цена за 1000 исходящих токенов	Стоимость исходящих потоков	Количество задач для человека	Стоимость выполнения каждой задачи для человека	Стоимость всех задач для человека	Итого
Логический вывод Claude Instant	5000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Логический вывод Claude 2.1	5000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Задачи для человека							50	0,21 USD	10,50 USD	10,50 USD
Итого										11,06 USD

Оценка модели, пример 2.

Цены на ресурсы по требованию
Разработчик приложения представляет набор данных для оценки модели с участием человека на основе Anthropic Claude 2.1 и Anthropic Claude Instant в регионе AWS «Восток США (Северная Вирджиния)».

Этот набор данных содержит 50 запросов, а для оценки каждого сочетания запроса и ответа разработчик требует использовать 2-х сотрудников (это значение указывается в параметре «количество сотрудников на запрос» при создании задания по оценке). Это означает, что задание по оценке будет состоять из 100 задач (по 1 задаче на каждый набор «запрос – ответ» на каждого сотрудника: 2 сотрудника × 50 наборов «запрос – ответ» = 100 задач для человека).

50 запросов в сумме содержат 5000 входящих токенов, а ответы – 15 тысяч токенов для Anthropic Claude Instant и 20 тысяч токенов для Anthropic Claude 2.1.

Плата за эту работу по оценке модели вычисляется следующим образом:

Элемент	Количество входящих токенов	Цена за 1000 входящих токенов	Стоимость входящих потоков	Количество исходящих токенов	Цена за 1000 исходящих токенов	Стоимость исходящих потоков	Количество задач для человека	Стоимость выполнения каждой задачи для человека	Стоимость всех задач для человека	Итого
Логический вывод Claude Instant	5000	0,0008 USD	0,0040 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Логический вывод Claude 2.1	5000	0,008 USD	0,0400 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Задачи для человека							100	0,21 USD	21,00 USD	21,00 USD
Итого										21,56 USD

Оптимизация текстовых запросов

Пример. Сводка новостей
Разработчик приложения создает текстовый запрос, чтобы выполнять обобщения новостей для предприятий розничной торговли, использующих Claude 3.5. Оригинальный текстовый запрос включает 429 токенов. Оптимизированный текстовый запрос содержит 511 токенов, а также более конкретные инструкции и примеры для получения более краткого ответа от базовых моделей (FM). Кроме того, он использует оптимизированный текстовый запрос с 511 токенами в качестве входных данных для оптимизатора текстового запроса и создает 2 новых варианта для Claude 3.7 и Nova Pro с 582 и 579 токенами.

Общее количество токенов ввода и вывода для оптимизации текстового запроса: 429 + 511 + 511 + 582 + 511 + 579 = 3123

Общий ежемесячный счет: 3123 / 1000 * 0,03 USD = 0,09 USD
Stability AI

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL для создания изображения размером 512 × 512 с величиной шага 70 (премиальное качество).

Общая стоимость = 1 изображение * 0,036 USD за изображение = 0,036 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL 1.0 для создания изображения размером 1024 × 1024 с величиной шага 70 (премиальное качество).

Общая стоимость = 1 изображение * 0,08 USD за изображение = 0,08 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели SDXL 1.0 с подпиской на один месяц.

Общая стоимость = 1 * 49,86 USD * 24 часа * 31 день = 37 095,84 USD
TwelveLabs

Цены по требованию

Разработчик приложения выполняет следующий вызов API к Amazon Bedrock: запрос к модели Pegasus 1.2 для описания содержимого 10-секундного видео, который возвращает результат в объеме 2000 токенов.

Общая стоимость = 10 секунд * 0,00049 USD + 2 тыс. токенов / 1000 * 0,0075 USD = 0,0199 USD

Разработчик приложения обращается к Amazon Bedrock со следующими вызовами API: запрашивает модель Marengo Embed [3.0 или 2.7] для вставки 10 видеороликов общей продолжительностью 100 минут.

Общая стоимость = 100 минут (т.е. 6000 секунд) * 0,00070 USD = 4,2 USD

Разработчик приложения обращается к Amazon Bedrock со следующими вызовами API: запрашивает модель Marengo Embed 3.0, чтобы, введя текст и изображение, создать встраивание, которое можно использовать для поиска клипа с сумкой, показанной на данном изображении, в репозитории встраиваний, созданном по приведенному выше примеру.

Общая стоимость = 1 текстовый запрос * 0,00007 USD +1 запрос на изображение * 0,0001 USD = 0,00017 USD

Разработчик приложения обращается к Amazon Bedrock со следующими вызовами API: запрашивает модель Marengo Embed [3.0 или 2.7], предоставляя текст для создания встраивания, который можно было бы использовать для поиска подходящих клипов из репозитория встраиваний, созданном по приведенному выше примеру.

Общая сумма понесенных расходов = 1 текстовый запрос * 0,00007 USD = 0,00007 USD
Writer

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Writer’s Palmyra X5 для суммирования вводного потока из 10 000 токенов входного текста в итоговый поток из 2000 токенов.

Общая стоимость = 10 000 токенов / 1000 * 0,003 USD + 2000 токенов / 1000 * 0,015 USD = 0,06 USD

Дальнейшие шаги

Семинар

Ознакомьтесь с типовыми примерами использования Amazon Bedrock на практическом семинаре

Посмотреть семинар

Демонстрация

Ознакомьтесь с демонстрационными версиями возможностей Amazon Bedrock

Изучите библиотеку демонстраций

Модели Meta	Стоимость обучения 1000 токенов	*Цена хранения каждой пользовательской модели в месяц**	Цена вывода для пользовательской модели за 1 элемент модели в час (без учета стоимости выделенной пропускной способности)
Llama 2, предварительно обученная (13 млрд)	0,00149 USD	1,95 USD	23,50 USD
Llama 2, предварительно обученная (70 млрд)	0,00799 USD	1,95 USD	23,50 USD

Модели Meta	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Llama 2, предварительно обученная и Chat (13 млрд)	21,18 USD	13,08 USD
Llama 2, предварительно обученная (70 млрд)	21,18 USD	13,08 USD

Цены на Amazon Bedrock

Обзор цен

Уровни обслуживания и импорт моделей

Стандартный уровень

Приоритетный уровень

Гибкий уровень

Пакетный режим

Импорт пользовательских моделей

Настройка и оптимизация

Настройка модели

Кэширование текстовых запросов

Управление запросами и оптимизация

Инструменты

Ограничения

Базы знаний

Автоматизация обработки данных Amazon Bedrock

Потоки

Оценки

Сведения о ценах на модели

AI21 Labs

Amazon Nova

Цены на модели понимания

Межрегиональный вывод

Географический, внутрирегиональный и межрегиональный вывод

Встроенные инструменты

Цены на модели генерации креативного контента

Цены на модели распознавания и генерации речи

Цены по требованию на базовые модели преобразования речи в речь

Цены на модели встраивания

Amazon Titan

Anthropic

Cohere

DeepSeek

Google

Kimi AI

Цены по требованию

Meta

MiniMax AI

Mistral AI

NVIDIA

OpenAI

TwelveLabs

Stability AI

Writer

Qwen

Импорт пользовательских моделей

Инструменты и сведения о ценах на оптимизацию

Потоки Amazon Bedrock

Ограничения для Amazon Bedrock

Оценка модели

Автоматизация обработки данных

Оптимизация текстового запроса для Amazon Bedrock

Примеры расчета цен

AI21 Labs

Amazon

Цены по требованию

Оплата за настройку (тонкую настройку и непрерывное предварительное обучение)

Оплата за выделенную пропускную способность

Ограничения для Amazon Bedrock

Базы знаний Amazon Bedrock

Anthropic

Цены по требованию

Оплата за выделенную пропускную способность

Cohere

Цены по требованию

Оплата за настройку (тонкую настройку)

Импорт пользовательских моделей

Автоматизация обработки данных

DeepSeek

Рабочие процессы

Meta

Цены по требованию

Оплата за настройку (тонкую настройку)

Оплата за выделенную пропускную способность

Mistral AI

Цены по требованию

Оценка модели

Оценка модели, пример 1.

Оценка модели, пример 2.

Оптимизация текстовых запросов