Модели формирования цен

По требованию

В режиме «По требованию» вы платите только за то, чем реально пользуетесь, без подписки на определенный срок. Для моделей генерации текста плата взимается за каждый обработанный входной токен и каждый сгенерированный выходной токен. Для моделей встраивания плата взимается за каждый обработанный входной токен. Каждый токен состоит из нескольких символов и определяет базовую единицу текста, которую изучает модель для понимания входных данных и подсказок пользователя. Для моделей генерации изображений плата взимается за каждое созданное изображение.

Пакетный режим

В пакетном режиме вы можете предоставлять набор запросов в одном входном файле и получать ответы в одном выходном файле, что позволяет получать прогнозы в больших масштабах. Ответы обрабатываются и хранятся в корзине Amazon S3, и вы можете обращаться к ним в любое время после обработки. Цены на пакетный режим вычисляются так же, как в режиме «По требованию».

За выделенную пропускную способность

В режиме «За выделенную пропускную способность» вы можете приобрести элементы модели для определенной базовой или пользовательской модели. Режим «За выделенную пропускную способность» в первую очередь предназначен для больших рабочих нагрузок постоянного вывода, которым требуется гарантированная пропускная способность. Доступ к пользовательским моделям возможен только в режиме «За выделенную пропускную способность». Элемент модели предоставляет определенную пропускную способность, которая измеряется максимальным количеством входных и выходных токенов, обрабатываемых в минуту. При использовании режима «За выделенную пропускную способность» оплата начисляется за каждый час использования, и вы можете выбрать срок действия подписки: на 1 или 6 месяцев.

Настройка модели

При работе с Amazon Bedrock вы можете настроить для базовых моделей собственные данные, чтобы предоставлять персонализированные ответы с учетом конкретных задач и бизнес-контекста. Вы можете доработать модели, используя данные с метками или непрерывное предварительное обучение с данными без меток. При настройке модели генерации текста взимается плата за обучение модели на основе общего количества обработанных моделью токенов (количество токенов в корпусе обучающих данных, умноженное на количество эпох), а также за ежемесячное хранение модели. Эпохой называется полный цикл обработки набора данных для обучения на этапах настройки или непрерывного предварительного обучения Вывод по моделям оплачивается в соответствии с планом «За выделенную пропускную способность», который является обязательным для их использования. Один элемент модели для вывода по пользовательской модели предоставляется без подписки. Плата будет взиматься за количество часов, в течение которых вы используете первый элемент модели для вывода по пользовательской модели. Если вы хотите получить пропускную способность выше одного элемента модели, необходимо оформить подписку на 1 или 6 месяцев.

Мощные инструменты для создания без дополнительной оплаты

При использовании агентов и баз знаний для Amazon Bedrock плата взимается только за модели и векторные базы данных, которые вы используете для них.

Распределение цен

Цены зависят от формы предоставления, поставщика и модели. Выберите поставщика модели, чтобы увидеть подробные цены.

AI21 Labs

Цены по требованию и для пакетного режима

Модели AI21 Labs Цена за 1000 входящих токенов Цена за 1000 исходящих токенов

Jurassic-2 Mid

0,0125 USD

0,0125 USD

Jurassic-2 Ultra

0,0188 USD

0,0188 USD

В настоящее время модели AI21 Labs на Amazon Bedrock не поддерживают настройку модели (тонкая настройка) и выделенную пропускную способность.

Amazon

Region

Anthropic

Цены по требованию и для пакетного режима

Регион: Восток США (Северная Вирджиния) и Запад США (Орегон)

Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов

Claude Instant

0,00080 USD

0,00240 USD

Claude

0,00800 USD

0,02400 USD

Регион: Азиатско-Тихоокеанский регион (Токио)

Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов

Claude Instant

0,00080 USD

0,00240 USD

Claude

0,00800 USD

0,02400 USD

Регион: Европа (Франкфурт)

Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов

Claude Instant

0,00080 USD

0,00240 USD

Claude

0,00800 USD

0,02400 USD

Оплата за выделенную пропускную способность

Регион: Восток США (Северная Вирджиния) и Запад США (Орегон)

Модели Anthropic Цена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев

Claude Instant

39,60 USD

22,00 USD

Claude

63,00 USD

35,00 USD

Регион: Азиатско-Тихоокеанский регион (Токио)

Модели Anthropic Цена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев

Claude Instant

53,00 USD

29,00 USD

Claude

86,00 USD

48,00 USD

Регион: Европа (Франкфурт)

Модели Anthropic Цена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев

Claude Instant

49,00 USD

27,00 USD

Claude

79,00 USD

44,00 USD

Обратитесь к команде по работе с клиентами AWS для получения более подробной информации об элементах модели. 

Cohere

Цены по требованию и для пакетного режима

Модели Cohere Цена за 1000 входящих токенов Цена за 1000 исходящих токенов
Command 0,0015 USD 0,0020 USD
Command-Light 0,0003 USD 0,0006 USD
Embed – английский язык 0,0001 USD н/д
Embed – многоязычная 0,0001 USD н/д

Цены на настройку (тонкая настройка)

Модели Cohere Стоимость обучения 1000 токенов Цена хранения каждой индивидуальной модели в месяц Цена вывода для пользовательской модели за каждый элемент модели в час (при условии оплаты за выделенную пропускную способность без подписки)

Cohere Command

0,004 USD

1,95 USD

49,50 USD

Cohere Command-Light 0,001 USD

1,95 USD

8,56 USD

*Общее количество обученных токенов = количество токенов в корпусе обучающих данных * количество эпох

Оплата за выделенную пропускную способность

Модели Cohere Цена за час за элемент модели по подписке на 1 месяц

Цена за час за элемент модели по подписке на 6 месяцев

Cohere Command

39,60 USD

23,77 USD

Cohere Command-Light

6,85 USD

4,11 USD

Обратитесь к команде по работе с клиентами AWS или в отдел продаж для получения более подробной информации об элементах модели. 

Meta Llama 2

Цены по требованию и для пакетного режима 

Модели Meta Цена за 1000 входящих токенов Цена за 1000 исходящих токенов

Llama 2 Chat (13 млрд)

0,00075 USD

0,00100 USD

Llama 2 Chat (70 млрд)

0,00195 USD

0,00256 USD

Цены на настройку модели (тонкая настройка)

Модели Meta Стоимость обучения 1000 токенов Цена хранения каждой пользовательской модели* в месяц Цена вывода для пользовательской модели за 1 элемент модели в час (без учета стоимости выделенной пропускной способности)

Llama 2, предварительно обученная (13 млрд)

0,00149 USD

1,95 USD

23,50 USD

Llama 2, предварительно обученная (70 млрд)

0,00799 USD

1,95 USD 23,50 USD

* Хранение пользовательских моделей = 1,95 USD

Оплата за выделенную пропускную способность

Модели Meta Цена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев

Llama 2 предварительно обученная и Chat (13 млрд)

21,18 USD

13,08 USD

Llama 2, предварительно обученная (70 млрд)

21,18 USD

13,08 USD

*Предварительно обученные модели Llama 2 доступны только с выделенной пропускной способностью после настройки.

Обратитесь к команде по работе с клиентами AWS или в отдел продаж для получения более подробной информации об элементах модели.

Stability AI

Цены по требованию и для пакетного режима

Модели изображений, предлагаемые Stability AI, оплачиваются за количество изображений с учетом количества шагов и разрешения изображения:

Модель Stability AI Разрешение изображения Цена за созданное изображение в стандартном качестве (не более 50 шагов) Цена за созданное изображение в превосходном качестве (более 50 шагов)

 

SDXL 0,8

512×512 или меньше

0,018 USD за изображение

0,036 USD за изображение

Больше 512×512

0,036 USD за изображение

0,072 USD за изображение

SDXL 1.0

Не более 1024×1024

0,04 USD 0,08 USD

Оплата за выделенную пропускную способность

Модель Stability AI Цена за час за элемент модели по подписке на 1 месяц* Цена за час за элемент модели по подписке на 6 месяцев*

SDXL 1.0

49,86 USD

46,18 USD

*Включает вывод по базовым и пользовательским моделям.

Обратитесь к команде по работе с клиентами AWS или в отдел продаж для получения более подробной информации об элементах модели.

В настоящее время настройка моделей Stability AI (тонкая настройка) в Amazon Bedrock не поддерживается.

Примеры расчета стоимости

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Jurrasic-2 Mid от AI21 Labs для суммирования вводного потока из 10 000 токенов входного текста в итоговый поток из 2000 токенов.

Общая стоимость = 10 000 токенов / 1000 * 0,0125 USD + 2000 токенов / 1000 * 0,0125 USD = 0,15 USD

Оплата по запросу

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Amazon Titan Text – Lite для суммирования вводного потока из 2000 токенов входного текста в итоговый поток из 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,0003 USD + 1000 токенов / 1000 * 0,0004 USD = 0,001 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к базовой модели генератора изображений Titan для создания 1000 изображений размером 1024 x 1024 в стандартном качестве

Общая стоимость = 1000 изображений * 0,01 USD за изображение = 10 USD

Оплата за настройку (тонкая настройка и непрерывное предварительное обучение)

Разработчик приложения настраивает модель генератора изображений Titan, используя 1000 пар «изображение – текст». После обучения разработчик использует выделенную для пользовательской модели пропускную способность в течение одного часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение одного месяца. После оценки разработчик использует выделенную пропускную способность (с обязательством на один месяц) для размещения настраиваемой модели.

В ежемесячную стоимость тонкой настройки входит обучение тонкой настройке (0,005 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода пользовательской модели (21 USD). Итого: 5 USD + 1,95 USD + 21 USD = 27,95 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает два элемента модели Titan Text Express с обязательством на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц: 2 элемента модели * 18,40 USD/час * 24 часа * 31 день = 27 379,20 USD

Разработчик приложения покупает один элемент модели базовой модели генератора изображений Titan с обязательством на один месяц.

Общая стоимость = 1 * 16,20 USD * 24 часа * 31 день = 12 052,80 USD

Оплата по запросу

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock в регионе Запад США (Орегон): запрос к модели Claude от Anthropic для суммирования вводного потока из 11 000 токенов входного текста в итоговый поток из 4000 токенов.

Общая стоимость = 11 000 токенов / 1000 * 0,008 USD + 4000 токенов / 1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Anthropic Claude Instant в регионе Запад США (Орегон).

Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD

Оплата по запросу

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command от Cohere для суммирования вводного потока из 6000 токенов входного текста в итоговый поток из 2000 токенов.

Общая стоимость = 6000 токенов / 1000 * 0,00150 USD + 2000 токенов / 1000 * 0,0020 USD = 0,013 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command-Light от Cohere для суммирования вводного потока из 6000 токенов входного текста в итоговый поток из 2000 токенов.

Общая стоимость = 6000 токенов / 1000 * 0,0003 USD + 2000 токенов / 1000 * 0,0006 USD = 0,003 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Embed English или многоязычной модели от Cohere, чтобы создавать вложения для 10 000 токенов вводного потока.

Общая стоимость = 10 000 токенов / 1000 * 0,0001 USD = 0,001 USD

Оплата за настройку (тонкая настройка)

Разработчик приложения настраивает командную модель Cohere, используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение одного часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение одного месяца. После оценки разработчик использует выделенную пропускную способность (с обязательством на один месяц) для размещения настраиваемой модели.

В ежемесячную стоимость тонкой настройки входит обучение тонкой настройке (0,004 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода пользовательской модели (49,50 USD). Итого: 55,45 USD

Ежемесячная стоимость выделенной пропускной способности (с обязательством на один месяц) пользовательской модели составляет 39,60 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Cohere Command с обязательством на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD

Оплата по запросу

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Llama 2 Chat (13B) от Meta для суммирования вводного потока из 2000 токенов входного текста в итоговый поток из 500 токенов.

Общая стоимость = 2000 токенов / 1000 * 0,00075 USD + 500 токенов / 1000 USD * 0,001 USD = 0,002 USD

Оплата за настройку (тонкая настройка)

Разработчик приложения настраивает предварительно обученную модель Llama 2 (70B), используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение одного часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение одного месяца. После оценки разработчик использует выделенную пропускную способность (с обязательством на один месяц) для размещения настраиваемой модели.

В ежемесячную стоимость тонкой настройки входит обучение тонкой настройке (0,00799 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода пользовательской модели (23,50 USD). Итого: 33,44 USD

Ежемесячная стоимость выделенной пропускной способности (с обязательством на один месяц) пользовательской модели составляет 21,18 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Meta Llama 2 с обязательством на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц: 1 элемент модели * 21,20 USD * 24 часа * 31 день = 15 772,8 USD

Примеры расчета цен

  • Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Jurrasic-2 Mid от AI21 Labs для суммирования вводного потока из 10 000 токенов входного текста в итоговый поток из 2000 токенов.

    Общая стоимость = 10 000 токенов / 1000 * 0,0125 USD + 2000 токенов / 1000 * 0,0125 USD = 0,15 USD

  • Цены по требованию

    Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Amazon Titan Text – Lite для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.

    Общая стоимость в час = 2000 токенов / 1000 * 0,0003 USD + 1000 токенов / 1000 * 0,0004 USD = 0,001 USD

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к базовой модели генератора изображений Titan для создания 1000 изображений размером 1024×1024 в стандартном качестве

    Общая стоимость = 1000 изображений * 0,01 USD за изображение = 10 USD

    Оплата за настройку (тонкая настройка и непрерывное предварительное обучение)

    Разработчик приложения настраивает модель генератора изображений Titan, используя 1000 пар «изображение – текст». После обучения разработчик использует выделенную для пользовательской модели пропускную способность в течение одного часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение одного месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

    Ежемесячные затраты на тонкую настройку вычисляются так: обучение для тонкой настройки (0,005 USD × 500 × 64 USD), где 0,005 USD – цена за просмотренное изображение, 500 – количество шагов, 64 – размер партии плюс хранение пользовательской модели в месяц (1,95 USD) + 1 час анализа пользовательской модели (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Оплата за выделенную пропускную способность

    Разработчик приложения покупает два элемента модели Titan Text Express с подпиской на один месяц, чтобы использовать ее для обобщения текста.

    Общая стоимость в месяц: 2 элемента модели * 18,40 USD/час * 24 часа * 31 день = 27 379,20 USD

    Разработчик приложения покупает один элемент модели базовой модели генератора изображений Titan с подпиской на один месяц.

    Общая стоимость = 1 * 16,20 USD * 24 часа * 31 день = 12 052,80 USD

  • Цены по требованию

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock в регионе Запад США (Орегон): запрос к модели Claude от Anthropic для суммирования входящего потока из 11 000 токенов входящего текста в исходящий поток размером 4000 токенов.

    Общая стоимость = 11 000 токенов / 1000 * 0,008 USD + 4000 токенов / 1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Оплата за выделенную пропускную способность

    Разработчик приложения покупает один элемент модели Anthropic Claude Instant в регионе Запад США (Орегон).

    Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD

  • Цены по требованию

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.

    Общая стоимость = 6000 токенов / 1000 * 0,00150 USD + 2000 токенов / 1000 * 0,0020 USD = 0,013 USD

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command-Light от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.

    Общая стоимость = 6000 токенов / 1000 * 0,0003 USD + 2000 токенов / 1000 * 0,0006 USD = 0,003 USD

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Embed English или многоязычной модели от Cohere, чтобы создавать вложения для 10 000 токенов входящего потока.

    Общая стоимость = 10 000 токенов / 1000 * 0,0001 USD = 0,001 USD

    Оплата за настройку (тонкая настройка)

    Разработчик приложения настраивает командную модель Cohere, используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение одного часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение одного месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

    В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,004 USD × 1000), хранение пользовательских моделей в месяц (1,95 USD) и один час вывода по пользовательской модели (49,50 USD). Итого: 55,45 USD

    Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 39,60 USD

    Оплата за выделенную пропускную способность

    Разработчик приложения покупает один элемент модели Cohere Command с подпиской на один месяц, чтобы использовать ее для обобщения текста.

    Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD

  • Цены по требованию

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Llama 2 Chat (13B) от Meta для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток размером 500 токенов.

    Общая стоимость = 2000 токенов / 1000 * 0,00075 USD + 500 токенов / 1000 USD * 0,001 USD = 0,002 USD

    Оплата за настройку (тонкая настройка)

    Разработчик приложения настраивает предварительно обученную модель Llama 2 (70B), используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение одного часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение одного месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

    В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,00799 USD × 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода по пользовательской модели (23,50 USD). Итого: 33,44 USD

    Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 21,18 USD

    Оплата за выделенную пропускную способность

    Разработчик приложения покупает один элемент модели Meta Llama 2 с подпиской на один месяц, чтобы использовать ее для обобщения текста.

    Общая стоимость в месяц: 1 элемент модели * 21,20 USD * 24 часа * 31 день = 15 772,8 USD

  • Цены по требованию

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL для создания изображения размером 512×512 с величиной шага 70 (премиальное качество)

    Общая стоимость = 1 изображение * 0,036 USD за изображение = 0,036 USD

    Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL1.0 для создания изображения размером 1024×1024 с величиной шага 70 (премиальное качество)

    Общая стоимость = 1 изображение * 0,08 USD за изображение = 0,08 USD

    Оплата за выделенную пропускную способность

    Разработчик приложения покупает один элемент модели SDXL1.0 с подпиской на один месяц.

    Общая стоимость = 1 * 49,86 USD * 24 часа * 31 день = 37 095,84 USD