Обзор цен
За счет широкого спектра специализированных возможностей Amazon SageMaker помогает специалистам по работе с данными и разработчикам в быстрой подготовке, создании, обучении и развертывании высококачественных моделей машинного обучения. Amazon SageMaker поддерживает ведущие платформы машинного обучения, инструментарии и языки программирования.
При работе с SageMaker оплате подлежат только используемые ресурсы. Доступно два варианта оплаты: по факту использования без минимальных платежей и долгосрочных обязательств и тарифы SageMaker Savings Plans с гибкой моделью ценообразования на основе использования при условии, что клиент обязуется применять постоянный объем ресурсов.
Уровень бесплатного пользования Amazon SageMaker
Сервис Amazon SageMaker можно попробовать бесплатно. В рамках уровня бесплатного пользования AWS работу с Amazon SageMaker можно начать бесплатно. Действие уровня бесплатного пользования начинается с первого месяца, как только вы создали первый ресурс SageMaker. Подробные сведения об уровне бесплатного пользования для Amazon SageMaker приведены в таблице ниже.
Возможности Amazon SageMaker | Ежемесячное использование уровня бесплатного пользования в течение первых 2 месяцев |
Блокноты Studio и инстансы блокнотов | 250 часов инстанса ml.t3.medium в блокнотах Studio ИЛИ 250 часов инстанса ml.t2 medium или инстанса ml.t3.medium на инстансах блокнотов |
RStudio в SageMaker | 250 часов работы инстанса ml.t3.medium с приложением RSession И бесплатного инстанса ml.t3.medium для приложения RStudioServerPro |
Data Wrangler | 25 часов инстанса ml.m5.4xlarge |
Хранилище функций | 10 миллионов единиц записи, 10 миллионов единиц чтения, 25 ГБ памяти (стандартное онлайн-хранилище) |
Обучение | 50 часов инстансов m4.xlarge или m5.xlarge |
Amazon SageMaker с TensorBoard | 300 часов работы инстанса ml.r5.large |
Получение логических выводов в режиме реального времени | 125 часов инстансов m4.xlarge или m5.xlarge |
Бессерверное получение логических выводов | 150 000 секунд на получение логических выводов по требованию |
Canvas | 160 часов в месяц за длительность сеансов |
HyperPod | 50 часов работы инстанса m5.xlarge |
Цены по требованию
-
Студия Classic
-
JupyterLab
-
Code Editor
-
RStudio
-
Инстансы блокнота
-
Обработка
-
TensorBoard
-
Data Wrangler
-
Хранилище функций
-
Обучение
-
MLflow
-
Получение логических выводов в режиме реального времени
-
Асинхронные логические выводы
-
Пакетное преобразование
-
Бессерверное получение логических выводов
-
JumpStart
-
Profiler
-
HyperPod
-
Оптимизация логических выводов
-
Студия Classic
-
Студия Amazon SageMaker Classic
Студия Classic предлагает готовые блокноты Jupyter для нашей устаревшей интегрированной среды разработки (IDE). Базовые вычислительные ресурсы целиком эластичны, а общий доступ к блокнотам предоставляется без особого труда, благодаря чему возможна оптимизированная совместная работа. Плата взимается в зависимости от типа выбранного инстанса в соответствии с продолжительностью использования. -
JupyterLab
-
Amazon SageMaker JupyterLab
Запускайте полностью управляемый инстанс JupyterLab за считаные секунды. Используйте новейшую интерактивную веб-среду разработки для блокнотов, кода и данных. Плата взимается в зависимости от типа выбранного инстанса в соответствии с продолжительностью использования. -
Code Editor
-
Amazon SageMaker Code Editor
Code Editor на основе Visual Studio Code – Open Source (Code-OSS) дает возможность писать, тестировать, отлаживать и запускать код для аналитики и машинного обучения. Эта среда полностью интегрирована с SageMaker Studio и поддерживает расширения IDE, доступные в реестре расширений Open VSX. -
RStudio
-
RStudio
RStudio предоставляет по требованию облачные вычислительные ресурсы и дает возможность ускорить разработку модели и повысить продуктивность. С вас взимается плата за типы инстанса, выбранные для запуска приложения для проведения сеансов RStudio и приложения RStudio Server Pro.
Приложение RStudioServerPro
-
Инстансы блокнота
-
Инстансы блокнота
Инстансы блокнотов – это вычислительные инстансы с установленным приложением блокнота Jupyter. Плата взимается в зависимости от типа выбранного инстанса в соответствии с продолжительностью использования.
-
Обработка
-
Amazon SageMaker Processing
С помощью Amazon SageMaker Processing можно легко запустить предварительную и последующую обработку рабочих нагрузок, а также провести оценку модели в полностью управляемой инфраструктуре. Плата взимается в зависимости от типа выбранного инстанса в соответствии с продолжительностью использования.
-
TensorBoard
-
Amazon SageMaker с TensorBoard
Amazon SageMaker с TensorBoard предоставляет хостинг TensorBoard, позволяющий визуализировать и отлаживать проблемы конвергенции моделей при выполнении учебных заданий по Amazon SageMaker.
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler сокращает время, необходимое для сбора и подготовки данных для машинного обучения с нескольких недель до нескольких минут. Вы платите за время, затрачиваемое на очистку, поиск и визуализацию данных. Для клиентов, использующих инстансы SageMaker Data Wrangler, действуют цены, указанные ниже*. Для клиентов, использующих SageMaker Data Wrangler на инстансах рабочей среды SageMaker Canvas, действуют цены SageMaker Canvas. Подробнее см. на странице цен на SageMaker Canvas.
Задания Amazon SageMaker Data Wrangler
Задание Amazon SageMaker Data Wrangler создается во время экспорта потока данных из SageMaker Data Wrangler. С помощью заданий SageMaker Data Wrangler можно автоматизировать рабочие процессы подготовки данных. Задания SageMaker Data Wrangler позволяют повторно применять рабочие процессы подготовки данных к новым наборам данных, сокращая временные затраты, и оплачиваются посекундно.
-
Хранилище функций
-
Магазин функций Amazon SageMaker
Хранилище функций Amazon SageMaker представляет собой центральный репозиторий для получения, хранения и запуска функций машинного обучения. За группу функций, запись, чтение и хранение данных в Хранилище функций SageMaker взимается плата. Помимо этого, цены за хранилище различаются в зависимости от того, стандартное оно или находится в памяти.В стандартном онлайн-хранилище плата за хранение данных взимается за 1 ГБ в месяц. Для обеспечения пропускной способности можно выбрать режим «по требованию» или режим «выделения ресурсов». В режиме «по требованию» плата за запись взимается в единицах запроса на запись за 1 КБ, а чтение – в виде единиц запроса на чтение за 4 КБ. При выборе режима выделенных ресурсов необходимо указать объем ресурсов чтения и записи, который может потребоваться приложению. Хранилище функций Amazon SageMaker взимает один WCU за каждую запись в секунду (до 1 КБ) и один RCU за каждое чтение в секунду (до 4 КБ). Плата взимается за ресурсы (чтение и запись), выделенные в группе функций, даже если вы не используете их полностью.
За хранилище в памяти плата за запись взимается в запросах на запись за килобайт (не менее 1 ед. за запись), за чтение – в виде запросов на чтение за килобайт (не менее 1 ед. за чтение). Для хранения данных плата взимается за 1 ГБ в час. Минимальная плата за хранение данных в хранилище в памяти составляет 5 ГиБ (5,37 ГБ) в час.
-
Обучение
-
Amazon SageMaker: обучение
Amazon SageMaker позволяет легко обучать модели машинного обучения, предоставляя все необходимое для настройки и отладки моделей. Вы платите за использование инстанса выбранного типа. При использовании Amazon SageMaker Debugger для отладки проблем и мониторинга ресурсов во время обучения вы можете использовать встроенные правила для отладки заданий обучения или написать собственные правила. За использование встроенных правил для отладки заданий обучения плата не взимается. При использовании собственных правил плата взимается в зависимости от типа выбранного инстанса в соответствии с продолжительностью использования.
-
MLflow
-
Amazon SageMaker с MLflow
Amazon SageMaker с MLflow позволяет клиентам платить только за то, что они используют. Клиенты платят за серверы отслеживания MLflow в зависимости от затрат на вычислительные ресурсы и хранение.
Клиенты будут платить за вычислительные ресурсы в зависимости от размера сервера отслеживания и количества часов его работы. Кроме того, клиенты будут платить за все метаданные, хранящиеся на сервере отслеживания MLflow.
-
Получение логических выводов в режиме реального времени
-
Хостинг Amazon SageMaker: получение логических выводов в режиме реального времени
Amazon SageMaker предоставляет логические выводы в режиме реального времени для конкретных примеров использования, для которых необходимы прогнозы в реальном времени. Вы платите за использование инстанса выбранного типа. При использовании Amazon SageMaker Model Monitor для обслуживания высокоточных моделей, предоставляющих логические выводы в режиме реального времени, для мониторинга моделей или составления собственных правил можно использовать встроенные правила. Вы получаете 30 бесплатных часов для мониторинга при использовании встроенных правил. Размер дополнительной платы будет зависеть от продолжительности использования. При использовании собственных правил плата взимается отдельно.
-
Асинхронные логические выводы
-
Асинхронные логические выводы Amazon SageMaker:
Асинхронные логические выводы Amazon SageMaker – это опция логического вывода почти в реальном времени, которая ставит входящие запросы в очередь и обрабатывает их асинхронно. Используйте ее тогда, когда необходимо обрабатывать объемные полезные нагрузки по мере поступления данных или запускать модели, которым требуется длительное время обработки выводов, но не нужна задержка менее секунды. Оплата взимается в зависимости от типа выбранного инстанса. -
Пакетное преобразование
-
Amazon SageMaker Batch Transform
Благодаря Amazon SageMaker Batch Transform вам не придется разбивать набор данных на несколько фрагментов или управлять адресами реального времени. SageMaker Batch Transform дает возможность выполнять прогнозирование на основе крупных или малых наборов данных. Плата взимается в зависимости от типа выбранного инстанса в соответствии с продолжительностью использования.
-
Бессерверное получение логических выводов
-
Amazon SageMaker Serverless Inference
Бессерверный вывод Amazon SageMaker позволяет развертывать модели машинного обучения, чтобы получать логические выводы, исключая необходимость настраивать базовую инфраструктуру и управлять ею. Для обеспечения предсказуемой производительности можно использовать бессерверный вывод по требованию или добавить Provisioned Concurrency к адресу.При бессерверном получении логических выводов по требованию платить нужно только за объем вычислительных ресурсов, использованных для обработки соответствующих запросов (плата начисляется по миллисекундам), и объем обработанных данных. Размер платы за вычисления зависит от выбранной вами конфигурации памяти.
Provisioned ConcurrencyПри желании вы также можете включить Provisioned Concurrency для бессерверных адресов. Provisioned Concurrency позволяет развертывать модели на бессерверных адресах с предсказуемой производительностью и высокой масштабируемостью, обеспечивая готовность адресов к заданному количеству одновременных запросов и заданному времени. Как и для бессерверного получения логических выводов по требованию, при использовании функции Provisioned Concurrency платить нужно только за объем вычислительных ресурсов, использованных для обработки запросов на получение логических выводов (плата начисляется по миллисекундам), и объем обработанных данных. Вы также платите за использование Provisioned Concurrency в зависимости от настроенной памяти, продолжительности выделенной памяти и степени задействования функции Provisioned Concurrency.
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart поможет вам быстро и легко начать работу с машинным обучением благодаря доступу в один щелчок к популярным коллекциям моделей (также известным как «зоопарки» моделей). Кроме того, Jumpstart предлагает комплексные решения для разбора общих стандартных примеров использования машинного обучения, которые могут быть настроены под конкретные требования пользователя. Дополнительная плата за использование моделей или решений JumpStart не начисляется. Вы будете платить за часы работы базовых инстансов обучения и выводов так же, как если бы вы создали их вручную.
-
Profiler
-
Amazon SageMaker Profiler собирает данные системного уровня для визуализации трассировочных графиков ЦПУ и графического процессора с высоким разрешением. Этот инструмент призван помочь специалистам по исследованию данных и инженерам выявлять «узкие места» в производительности моделей глубокого обучения, связанные с аппаратным обеспечением, и сэкономить время обучения и его стоимость. В настоящее время SageMaker Profiler поддерживает профилирование только учебных заданий, использующих типы учебных вычислительных инстансов ml.g4dn.12xlarge, ml.p3dn.24xlarge и ml.p4d.24xlarge.
Регионы: Восток США (Огайо), Восток США (Северная Вирджиния), Запад США (Орегон), Европа (Франкфурт), Европа (Ирландия) и Израиль (Тель-Авив).В настоящее время Профилировщик Amazon SageMaker представлен только для ознакомления и доступен бесплатно для клиентов в поддерживаемых регионах.
-
HyperPod
-
Amazon SageMaker HyperPod
Возможность Amazon SageMaker HyperPod создана специально для ускорения разработки базовых моделей (FM). Она постоянно отслеживает состояние кластера, восстанавливает и заменяет неисправные узлы «на лету», а также часто сохраняет контрольные точки, чтобы автоматически возобновить обучение FM без потери прогресса. Благодаря этому обучение становится более отказоустойчивым. Возможность SageMaker HyperPod предварительно настроена с использованием распределенных учебных библиотек SageMaker, которые дают возможность повысить производительность обучения FM при полном использовании вычислительной и сетевой инфраструктуры кластераПримечание. Цены на SageMaker HyperPod не включают плату за сервисы, подключенные к кластерам HyperPod, такие как Amazon EKS, Amazon FSx для Lustre и Amazon Simple Storage Service (Amazon S3).
-
Оптимизация логических выводов
-
Набор инструментов для оптимизации логических выводов позволяет легко внедрить новейшие методы оптимизации, предоставляя высочайшую экономическую эффективность (SOTA) в Amazon SageMaker и экономя месяцы работы разработчиков. Из самых популярных методов оптимизации, предоставляемых SageMaker, можно выбрать подходящий, заранее запустить задачи оптимизации, провести оценочное тестирование для определения производительности и точности модели, а затем развернуть оптимизированную модель на адресе SageMaker для получения логических выводов.
Сведения об инстансах
Сведения о продукте: инстанс P5 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память инстанса (ТиБ) | Модель графического процессора | Графический процессор | Общий объем памяти графического процессора (ГБ) | Объем памяти на графический процессор (ГБ) | Пропускная способность сети (Гбит/с) | GPUDirect RDMA | Одноранговая связь графических процессоров | Хранилище инстансов (ТБ) | Пропускная способность EBS (Гбит/с) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | Да | NVSwitch 900 ГБ/с | 8x3.84 SSD на базе NVMe | 80 |
Сведения о продукте: инстанс P4d Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память инстанса (ГиБ) | Модель графического процессора | Графические процессоры | Общий объем памяти графического процессора (ГБ) | Объем памяти на графический процессор (ГБ) | Пропускная способность сети (Гбит/с) | GPUDirect RDMA | Одноранговая связь графических процессоров | Хранилище инстансов (ГБ) | Пропускная способность EBS (Гбит/с) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA И EFA | Да | NVSwitch 600 ГБ/с | 8x1000 SSD на базе NVMe | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA и EFA | Да | NVSwitch 600 ГБ/с | 8X1000 SSD на базе NVMe | 19 |
Сведения о продукте: инстанс P3 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память инстанса (ГиБ) | Модель графического процессора | Графические процессоры | Общий объем памяти графического процессора (ГБ) | Объем памяти на графический процессор (ГБ) | Пропускная способность сети (Гбит/с) | Одноранговая связь графических процессоров | Хранилище инстансов (ГБ) | Пропускная способность EBS (Гбит/с) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | До 10 | н/п | Только EBS | 1,5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | Только EBS | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | Только EBS | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 x 900 SSD на базе NVMe | 19 |
Сведения о продукте: инстанс P2 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память инстанса (ГиБ) | Модель графического процессора | Графические процессоры | Общий объем памяти графического процессора (ГБ) | Объем памяти на графический процессор (ГБ) | Пропускная способность сети (Гбит/с) | Пропускная способность EBS (Гбит/с) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | До 10 | Высокий уровень |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Сведения о продукте: инстанс G4 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память инстанса (ГиБ) | Модель графического процессора | Графические процессоры | Общий объем памяти графического процессора (ГБ) | Объем памяти на графический процессор (ГБ) | Пропускная способность сети (Гбит/с) | Хранилище инстансов (ГБ) | Пропускная способность EBS (Гбит/с) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | До 25 | 1 x 125 SSD на базе NVMe | До 3,5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | До 25 | 1 x 125 SSD на базе NVMe | До 3,5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | До 25 | 1 x 125 SSD на базе NVMe | 4,75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD на базе NVMe | 9,5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD на базе NVMe | 9,5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 x 900 SSD на базе NVMe | 9,5 |
Сведения о продукте: инстанс G5 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память инстанса (ГиБ) | Модель графического процессора | Графические процессоры | Общий объем памяти графического процессора (ГБ) | Объем памяти на графический процессор (ГБ) | Пропускная способность сети (Гбит/с) | Пропускная способность EBS (Гбит/с) | Хранилище инстансов (ГБ) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | До 10 | До 3,5 | 1x250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | До 10 | До 3,5 | 1x450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | До 25 | 8 | 1x600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2x3800 |
Сведения о продукте: инстанс Trn1 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память (ГиБ) | Акселераторы Trainium | Общий объем памяти акселератора (ГБ) | Объем памяти на акселератор (ГБ) | Хранилище инстансов (ГБ) | Пропускная способность сети (Гбит/с) | Пропускная способность EBS (Гбит/с) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 x 500 SSD на базе NVMe | До 12,5 | До 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 SSD на базе NVMe | 800 | 80 |
Сведения о продукте: инстанс Inf1 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память (ГиБ) | Акселераторы Inferentia | Общий объем памяти акселератора (ГБ) | Объем памяти на акселератор (ГБ) | Хранилище инстанса | Взаимосвязь между акселераторами | Пропускная способность сети (Гбит/с) | Пропускная способность EBS (Гбит/с) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | Только EBS | н/п | До 25 | До 4,75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | Только EBS | н/п | До 25 | До 4,75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | Только EBS | Да | 25 | 4,75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | Только EBS | да | 100 | 19 |
Сведения о продукте: инстанс Inf2 Amazon SageMaker
Размер инстанса | Виртуальные ЦПУ | Память (ГиБ) | Акселераторы Inferentia | Общий объем памяти акселератора (ГБ) | Объем памяти на акселератор (ГБ) | Хранилище инстанса | Взаимосвязь между акселераторами | Пропускная способность сети (Гбит/с) | Пропускная способность EBS (Гбит/с) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | Только EBS | н/п | До 25 | До 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | Только EBS | н/п | До 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | Только EBS | Да | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | Только EBS | Да | 100 | 60 |
Студия Amazon SageMaker
Студия Amazon SageMaker – это единый веб-интерфейс для полного цикла разработки решений машинного обучения с рядом полностью управляемых интегрированных сред разработки (IDE) и специализированных инструментов на выбор. Вы можете использовать Студию SageMaker бесплатно. Плата изымается только за базовые вычислительные ресурсы и хранилище, которые вы используете для различных инструментов IDE и машинного обучения в Студии SageMaker.
Можно использовать множество сервисов из Студии SageMaker, AWS SDK для Python (Boto3) или Интерфейса командной строки AWS (AWS CLI), включая нижеперечисленные.
- IDE в Студии SageMaker для полного цикла разработки решений машинного обучения с помощью широкого набора полностью управляемых IDE, в том числе JupyterLab, Code Editor на основе Visual Studio Code – Open Source (Code-OSS) и RStudio
- Конвейеры Amazon SageMaker для автоматизации и управления рабочими процессами машинного обучения;
- SageMaker автопилот для автоматического создания моделей машинного обучения с сохранением полной прозрачности;
- Эксперименты SageMaker для организации и отслеживания заданий обучения и версий;
- Отладчик SageMaker для отладки отклонений во время обучения;
- SageMaker Model Monitor для обслуживания моделей высокого качества;
- SageMaker Clarify для более понятного объяснения ваших моделей машинного обучения и обнаружения смещений;
- SageMaker JumpStart для простого развертывания решений машинного обучения для множества стандартных примеров использования. Плата при использовании других сервисов AWS может начисляться за базовые вызовы API, которые Amazon SageMaker выполняет от вашего имени.
- SageMaker Inference Recommender для получения рекомендаций для надлежащей настройки адреса.
Вы платите только за базовые вычислительные ресурсы и ресурсы хранения в SageMaker или других сервисах AWS в зависимости от их использования.
Чтобы использовать уровень бесплатного пользования Amazon Q для разработчиков в Jupyter Lab и Code Editor, следуйте приведенным здесь инструкциям. Чтобы использовать Amazon Q для профессиональных разработчиков в Jupyter Lab, необходимо подписаться на Amazon Q для разработчиков. С ценами на Amazon Q для разработчиков можно ознакомиться здесь.
Оценка базовых моделей
SageMaker Clarify поддерживает оценку базовых моделей автоматическими методами и с участием человека. Для каждого метода используются разные цены. Если вы оцениваете базовую модель из набора Amazon SageMaker JumpStart, которая еще не развернута в аккаунте, SageMaker на время вывода временно развернет эту модель JumpStart на специальном инстансе SageMaker. Тип инстанса будет подбираться в соответствии с рекомендациями JumpStart по инстансам для этой модели.
Автоматическая оценка:
Оценка базовой модели выполняется в задании обработки для SageMaker. Задание по оценке вызовет вывод SageMaker. С клиентов взимается плата за заключение и за выполнения задания по оценке. С клиентов взимается плата только за время выполнения задания по оценке. Стоимость задания по оценке будет определяться как сумма почасовых затрат на работу инстанса для оценки и почасовых затрат на работу инстанса хостинга.
Оценка с участием человека
При использовании оценки с участием человека плата взимается за три элемента: 1) использование экземпляра SageMaker для вывода, 2) использование инстанса для задания SageMaker по обработке, в рамках которого выполняется оценка с участием человека; 3) фиксированная плата в размере 0,21 USD за каждую выполненную задачу по оценке для человека. Задачей для человека считается каждое событие, в котором сотрудник оценивает один запрос и связанные с ним ответы системы вывода, используя пользовательский интерфейс оценки с участием человека. Цена будет одинаковой независимо от того, используете ли вы в задании одну или две модели, или создаете выводы собственными средствами. Также она не зависит от количества выбранных параметров и методов оценки. Цена 0,21 USD за каждую задачу одинакова для всех регионов AWS. Отдельная плата за работу сотрудников не взимается, так как персонал вы предоставляете самостоятельно.
Оценка под управлением AWS:
Цены на экспертную оценку под управлением AWS назначаются в частном порядке в соответствии с вашими потребностями по оценке, с привлечением группы экспертов AWS по оценке.
Лаборатория студии Amazon SageMaker
Можно создавать и обучать модели машинного обучения с помощью лаборатории студии Amazon SageMaker совершенно бесплатно. Лаборатория студии SageMaker предоставляет разработчикам, академикам и специалистам по работе с данными бесплатную и не требующую настройки среду для разработки и позволяет выполнять машинное обучение и экспериментировать с ним.
Amazon SageMaker Canvas
Amazon SageMaker Canvas расширяет доступ к машинному обучению, предоставляя бизнес-аналитикам возможности для точного прогнозирования машинного обучения с помощью интерактивного визуального интерфейса без написания кодов и взаимодействия с машинным обучением.
Маркировка данных Amazon SageMaker
Сервис Amazon SageMaker предоставляет два предложения для маркировки данных: Amazon SageMaker Ground Truth Plus и Amazon SageMaker Ground Truth. Узнайте подробные сведения о маркировке данных Amazon SageMaker, полностью управляемом сервисе маркировки данных, который упрощает построение высокоточных наборов обучающих данных для машинного обучения.
Теневое тестирование Amazon SageMaker
SageMaker помогает проводить теневые тесты для оценки новой модели машинного обучения перед выпуском в производство путем тестирования ее производительности по сравнению с текущей развернутой моделью. Дополнительная плата за теневое тестирование SageMaker не взимается, кроме платы за использование инстансов машинного обучения и хранилища машинного обучения, предоставленных для размещения теневой модели. Цены на инстансы машинного обучения и размеры хранилища машинного обучения такие же, как и на опцию вывода в реальном времени, указанную в предыдущей таблице цен. Дополнительная плата за данные, обрабатываемые в теневом развертывании и вне его, не взимается.
Amazon SageMaker Edge
Узнайте подробные сведения о ценах на Amazon SageMaker Edge. Это сервис для оптимизации, выполнения и мониторинга моделей машинного обучения в группах периферийных устройств.
Тарифы Amazon SageMaker Savings Plans
Экономичные планы Amazon SageMaker помогают снизить расходы вплоть до 64 %. Эти тарифы автоматически применяются к соответствующим инстансам SageMaker ML, включая блокноты SageMaker Studio, инстансы блокнота SageMaker, обработку SageMaker, SageMaker Data Wrangler, обучение SageMaker, получение логических выводов в режиме реального времени SageMaker и пакетное преобразование SageMaker, независимо от семейства инстансов, размера и региона. Например, для обработки рабочих нагрузок, связанных с получением логических выводов, вместо инстанса ml.c5.xlarge, работающего в регионе Восток США (Огайо), можно в любое время перейти к использованию инстанса ml.Inf1 в регионе Запад США (Орегон) и автоматически продолжать пользоваться экономичными планами.
Совокупная стоимость владения (TCO) с Amazon SageMaker
Amazon SageMaker позволяет снизить совокупную стоимость владения (TCO) не менее чем на 54 % в течение трех лет, по сравнению с другими облачными самоуправляемыми решениями. Узнайте подробные сведения о полном анализе TCO для Amazon SageMaker.
Примеры расчета цен
-
Пример расчета стоимости 1. JupyterLab
Как специалист по работе с данными на протяжении 20 дней вы используете JupyterLab для быстрых экспериментов с блокнотами, кодом и данными по шесть часов в день на инстансе ml.g4dn.xlarge. Вы создаете, а затем запускаете пространство JupyterLab для доступа к IDE JupyterLab. Плата за вычисления взимается только за инстанс, используемый для работы пространства JupyterLab. Плата за хранение для пространства JupyterLab начисляется до тех пор, пока оно не будет удалено.Вычисления
Инстанс Продолжительность Дни Общая продолжительность Стоимость в час Итого ml.g4dn.xlarge 6 часов 20 6 * 20 = 120 часов 0,7364 USD 88,368 USD Хранилище
Вы будете использовать SSD-хранилище общего назначения в течение 480 часов (24 часа * 20 дней). В регионе, где тариф составляет 0,1125 USD за 1 ГБ в месяц:
0,112 USD за 1 ГБ в месяц * 5 ГБ * 480 USD / (24 часа в сутки * 30 дней в месяц) = 0,373 USD -
Пример расчета стоимости 2. Code Editor
Как инженер по машинному обучению на протяжении 20 дней вы используете Code Editor для редактирования, выполнения и отладки производственного кода решений машинного обучения по шесть часов в день на инстансе ml.g4dn.xlarge. Вы создаете, а затем запускаете пространство Code Editor для доступа к IDE Code Editor. Плата за вычисления взимается только за инстанс, используемый для работы пространства Code Editor. Плата за хранение для пространства Code Editor начисляется до тех пор, пока оно не будет удалено.Вычисления
Инстанс Продолжительность Дни Общая продолжительность Стоимость в час Итого ml.g4dn.xlarge 6 часов 20 6 * 20 = 120 часов 0,7364 USD 88,368 USD Хранилище
Вы будете использовать SSD-хранилище общего назначения в течение 480 часов (24 часа * 20 дней). В регионе, где тариф составляет 0,1125 USD за 1 ГБ в месяц:
0,112 USD за 1 ГБ в месяц * 5 ГБ * 480 USD / (24 часа в сутки * 30 дней в месяц) = 0,373 USD
-
Пример расчета стоимости 3. Студия Classic
Специалист по работе с данными выполняет описанную ниже последовательность действий, используя блокноты в Студии Amazon SageMaker Classic.
- Открывает блокнот 1 в ядре TensorFlow на инстансе ml.c5.xlarge, а затем работает с этим блокнотом 1 час.
- Открывает блокнот 2 на инстансе ml.c5.xlarge. Он автоматически откроется в том же инстансе ml.c5.xlarge, что и блокнот 1.
- Работает одновременно с блокнотами 1 и 2 в течение 1 часа.
- Специалисту по работе с данными будет выставлен общий счет за 2 часа использования ml.c5.xlarge. За час, в течение которого специалист работал одновременно на блокнотах 1 и 2, будет учтено применение каждого ядра в течение 0,5 часа и выставлен счет за 1 час.
Применение ядра Инстанс блокнота Часы Стоимость в час Итого TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD Data Science ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Пример расчета стоимости 4. RStudio
Специалист по работе с данными выполняет описанную ниже последовательность действий, используя RStudio.
- Открывает RSession 1 на инстансе ml.c5.xlarge, затем работает с этим блокнотом 1 час.
- Открывает RSession 2 на инстансе ml.c5.xlarge. Он автоматически откроется в том же инстансе ml.c5.xlarge, на котором работает RSession 1.
- Работает одновременно в RSesssion 1 и RSession 2 в течение 1 часа.
- Специалисту по работе с данными будет выставлен общий счет за 2 (два) часа использования ml.c5.xlarge. За час, в течение которого специалист работал одновременно в RSession 1 и 2, будет учтено применение каждого RSession в течение 0,5 часа и выставлен счет за 1 час.
Тем временем RServer работает круглосуточно, независимо от наличия выполняющихся сеансов RSessions. Если администратор выбирает «Маленький» инстанс (ml.t3.medium), то он предоставляется бесплатно. Если администратор выбирает «Средний» инстанс (ml.c5.4xlarge) или «Большой» инстанс (ml.c5.9xlarge), то плата взимается за каждый час использования, пока работает RStudio для домена SageMaker.
Приложение RSession Инстанс RSession Часы Стоимость в час Итого Base R ml.c5.xlarge 1 0,204 USD 0,204 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Пример расчета стоимости 5. Обработка
Плата за Обработку Amazon SageMaker начисляется только за инстансы, используемые во время выполнения заданий. Когда вы предоставляете входные данные для обработки в Amazon S3, Amazon SageMaker скачивает эти данные из Amazon S3 в локальное хранилище данных перед началом задания обработки.
Специалист по обработке данных запускает задание обработки, чтобы предварительно обработать и проверить данные на двух инстансах ml.m5.4xlarge, что потребует 10 минут работы. Она загружает набор входных данных 100 ГБ в S3 для задания обработки, а выходные данные примерно такого же размера также будут сохраняться в S3.
Часы Инстансы обработки данных Стоимость в час Итого 1 x 2 x 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD Универсальное хранилище (SSD), ГБ Стоимость в час Итого 100 x 2 = 200 ГБ 0,14 USD 0,0032 USD Промежуточный итог: задание обработки Amazon SageMaker = 0,308 USD.
Промежуточный итог: универсальное хранилище SSD объемом 200 ГБ = 0,0032 USD.
Итоговая стоимость для этого примера составит 0,3112 USD.
-
Пример расчета стоимости 6. Data Wrangler
Согласно таблице выходит, что вы используете Amazon SageMaker Data Wrangler для подготовки данных всего 18 часов за три дня. Кроме этого вы создаете задание SageMaker Data Wrangler для подготовки обновленных данных на еженедельной основе. Продолжительность каждого задания составляет 40 минут, и задание выполняется еженедельно в течение одного месяца.
Общая стоимость использования Data Wrangler за месяц = 16,596 USD + 2,461 USD = 19,097 USD
Использование Инстанс SageMaker Studio Дни Продолжительность Общая продолжительность Стоимость в час Промежуточная стоимость SageMaker Data Wrangler ml.m5.4xlarge 3 6 часов 18 часов 0,922 USD 16,596 USD Задание SageMaker Data Wrangler ml.m5.4xlarge - 40 минут 2,67 часа 0,922 USD 2,461 USD Специалист по работе с данными тратит по шесть часов в течение трех дней на очистку, поиск и визуализацию данных с помощью Amazon SageMaker Data Wrangler. Чтобы выполнить конвейер подготовки данных, необходимо инициировать задание SageMaker Data Wrangler, запуск которого по расписанию должен осуществляться каждую неделю.
В приведенной ниже таблице расписано общее использование за месяц и связанные затраты на использование Amazon SageMaker Data Wrangler.
-
Пример расчета стоимости 7. Хранилище функций
++ Все дробные единицы чтения будут округлены до ближайшего целого значения
Хранилище данных
Общий объем хранимых данных = 31,5 ГБ
Ежемесячная плата за хранение данных = 31,5 ГБ x 0,45 USD = 14,175 USDОбщая ежемесячная плата за использование Хранилища функций Amazon SageMaker = 56,875 USD + 3,185 USD + 14,175 = 74,235 USD
День месяца Общее количество операций записи Общее количество единиц записи Общее количество операций чтения Общее количество единиц чтения Дней: 1–10 100 000 операций записи
(10 000 операций записи * 10 дней)2 500 000
(100 000 * 25 КБ)100 000
(10 000 * 10 дней)700 000++
(100 000 x 25/4 КБ)День 11 200 000 операций записи 5 000 000
(200 000 * 25 КБ)200 000 операций чтения 1 400 000++
(200 000 * 25/4 КБ)Дней: 12–30 1 520 000 операций записи
(80 000 * 19 дней)38 000 000
(1 520 000 x 25 КБ)1 520 000 операций записи
(80 000 x 19 дней)10 640 000++
(1 520 000 x 25/4 КБ)Общее количество платных единиц 45 500 000 единиц записи 12 740 000 единиц чтения Ежемесячная плата за операции записи и чтения 56,875 USD
(45,5 млн единиц записи * 1,25 USD за один миллион записей)3,185 USD
(12,74 млн единиц чтения * 0,25 USD за один миллион единиц чтения)У вас есть интернет-приложение, которое отправляет в Хранилище функций Amazon SageMaker операции чтения и записи объемом 25 КБ каждая. В течение первых 10 дней месяца вы получаете ограниченный трафик для приложения, который позволяет отправлять каждый день в магазин функций SageMaker 10 000 операций записи и 10 000 операций чтения. На 11‑й день месяца популярность приложения в социальной сети подскакивает, и в этот день трафик резко увеличивается до 200 000 операций чтения и 200 000 операций записи. Затем модель трафика приложения стабилизируется, и до конца месяца в среднем выполняется 80 000 операций чтения и 80 000 операций записи каждый день до конца месяца.
В приведенной ниже таблице расписано общее использование за месяц и связанные затраты на использование Хранилища функций Amazon SageMaker.
-
Пример расчета стоимости 8. Обучение
Общие затраты на обучение и отладку в нашем примере составят 2,38 USD. Вычислительные инстансы и тома хранения общего назначения, которые используются встроенными правилами Отладчика Amazon SageMaker, не приводят к дополнительным расходам.
Универсальное хранилище (SSD) для обучения (ГБ) Универсальное хранилище (SSD) для встроенных правил отладчика (ГБ) Универсальное хранилище (SSD) для настраиваемых правил отладчика (ГБ) Стоимость за ГБ в месяц Промежуточная сумма Используемая пропускная способность 3 2 1 Стоимость 0 USD Никаких дополнительных расходов на встроенный объем хранилища 0 USD 0,10 USD 0 USD Часы Инстанс для обучения Инстанс для отладки Стоимость в час Промежуточная сумма 4 x 0,5 = 2,00 ml.m4.4xlarge н/д 0,96 USD 1,92 USD 4 x 0,5 x 2 = 4 н/д Никаких дополнительных расходов на инстансы для встроенных правил 0 USD 0 USD 4 * 0,5 = 2,00 ml.m5.xlarge н/д 0,23 USD 0,46 USD ------- 2,38 USD Специалист по работе с данными в течение недели работал над моделью для воплощения новой идеи. Она обучила модель 4 раза на инстансе ml.m4.4xlarge, и каждое обучение выполнялось в течение 30 минут со включенным Amazon SageMaker Debugger, где настроены 2 встроенных и 1 настраиваемое правило, которое она написала сама. Для настраиваемого правила она указала инстанс ml.m5.xlarge. Для обучения она использует 3 ГБ обучающих данных, которые размещены в Amazon S3, а модель объемом 1 ГБ помещается в Amazon S3. SageMaker создает Универсальные тома SSD (gp2) для каждого инстанса обучения. Также SageMaker создает Универсальные тома SSD (gp2) для каждого используемого правила. В нашем примере это означает, что будут созданы 4 универсальных тома SSD (gp2). SageMaker Debugger выводит 1 ГБ отладочных данных в клиентскую корзину Amazon S3.
-
Пример расчета стоимости 9. MLflow
У вас есть две команды специалистов по работе с данными. Одна команда состоит из 10 специалистов по работе с данными, а другая – из 40. Для того чтобы удовлетворить потребности этих двух команд, вы решили включить два разных сервера отслеживания MLflow: малый и средний. Каждая команда проводит эксперименты с машинным обучением (ML) и должна записывать метрики, параметры и артефакты, полученные в результате попыток обучения. Команды хотят использовать серверы отслеживания MLflow в течение 160 часов в месяц. Предположим, что каждая команда специалистов по анализу данных хранит 1 ГБ метаданных для отслеживания выполнения экспериментов. Счет в конце месяца будет рассчитан, как указано ниже.
Плата за вычислительные ресурсы для малого инстанса: 160 * 0,60 USD = 96 USD
Плата за вычислительные ресурсы для среднего инстанса: 160 * 1,04 USD = 166,40 USD
Плата за хранение данных для двух команд: 2 * 1 * 0,10 = 0,20 USDИтого = 262,60 USD
-
Пример расчета стоимости 10. Получение логических выводов в режиме реального времени
Промежуточная сумма за обучение, хостинг и мониторинг – 305,827 USD. Промежуточная сумма за 3100 МБ обработанных входящих данных и 310 МБ обработанных исходящих данных в месяц = 0,054 USD. Стоимость для этого примера составляет 305,881 USD в месяц.
Обратите внимание, что для встроенных правил с инстансами ml.m5.xlarge вы бесплатно получаете до 30 часов мониторинга по всем адресам на каждый месяц.
Принятые данные за месяц: хостинг Переданные данные за месяц: хостинг Цена за гигабайт входящих или исходящих данных Итого 100 МБ * 31 = 3100 МБ 0,016 USD 0,0496 USD 10 МБ * 31 = 310 МБ 0,016 USD 0,00496 USD Часов в месяц Инстансы хостинга Инстансы Model Monitor Стоимость в час Итого 24 x 31 x 2 = 1488 ml.c5.xlarge 0,204 USD 303,522 USD 31 x 0,08 = 2,5 ml.m5.4xlarge 0,922 USD 2,305 USD Модель из примера 5 развертывается в рабочую среду с двумя (2) инстансами ml.c5.xlarge для обеспечения надежного хостинга в нескольких зонах доступности. Также используется Amazon SageMaker Model Monitor с одним (1) инстансом ml.m5.4xlarge, а задания мониторинга назначаются один раз в день. На завершение каждого задания мониторинга требуется около 5 минут. Ежедневно модель принимает 100 МБ данных. Логические выводы занимают 1/10 объема входящих данных.
-
Пример расчета стоимости 11. Асинхронные логические выводы
Итого за асинхронные логические выводы SageMaker = 15,81 USD + 0,56 USD + 2 * 0,0048 = 16,38 USD. Стоимость асинхронных логических выводов для этого примера составляет 16,38 USD в месяц.
Принятые данные за месяц Переданные данные за месяц Цена за гигабайт входящих или исходящих данных Итого 10 КБ * 1024 * 31 = 310 МБ 10 КБ * 1024 * 31 = 310 МБ 0,02 USD 0,0048 USD 10 КБ * 1024 * 31 = 310 МБ 0,02 USD 0,0048 USD Универсальное хранилище (SSD), ГБ Стоимость за ГБ в месяц Итого 4 0,14 USD 0,56 USD Часов в месяц Инстансы хостинга Стоимость в час Итого 2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD Плата за асинхронные логические выводы Amazon SageMaker начисляется за инстансы, используемые по вашему адресу. Если не идет активный процесс обработки запросов, можно настроить автоматическое масштабирование, чтобы снизить количество инстансов до нуля и сократить расходы. Для входящих полезных нагрузок Amazon S3, плата за чтение входных данных из Amazon S3 и запись выходных данных в S3 в пределах одного региона не начисляется.
Модель из примера 5 используется для запуска адреса асинхронных логических выводов SageMaker. В настройках адреса указан запуск на 1 инстансе ml.c5.xlarge и уменьшение количества инстансов до нуля, если не идет активной обработки запросов. За инстансом ml.c5.xlarge в адресе закреплено универсальное хранилище 4GB General Purpose (SSD). В этом примере адрес поддерживает 1 инстанс в течение 2 часов в день, а период охлаждения составляет 30 минут, после чего в течение остального дня количество используемых инстансов сокращается до нуля. Следовательно, с вас взимается плата за 2,5 часа использования в день.
Адрес обрабатывает 1024 запроса в день. Размер каждого тела запроса/отклика вызова составляет 10 КБ, а полезная нагрузка каждого запроса логического вывода в Amazon S3 – 100 МБ. Выходные данные логического вывода занимают 1/10 размера входных данных, которые хранятся в том же регионе Amazon S3. В этом примере плата за обработку данных взимается за тело запроса и отклика, но не за данные, переданные в хранилище Amazon S3 или из него.
-
Пример расчета стоимости 12. Batch Transform
Итоговая стоимость вывода для этого примера составит 2,88 USD.
Часы Инстансы хостинга Стоимость в час Итого 3 х 0,25 х 4 = 3 часа ml.m4.4xlarge 0,96 USD 2,88 USD Модель из примера 5 используется для выполнения SageMaker Batch Transform. Специалист по работе с данными запускает четыре отдельных задания SageMaker Batch Transform на трех инстансах ml.m4.4xlarge в течение 15 минут для каждого задания. При каждом запуске специалист загружает из S3 набор данных для оценки, который занимает 1 ГБ, при этом логические выводы, сохраняющиеся в S3, занимают 1/10 объема входных данных.
-
Пример ценообразования 13. Бессерверное получение логических выводов по требованию
Ежемесячная плата за обработку данных
Обработка данных (ГБ) Цена за гигабайт входящих или исходящих данных Ежемесячная плата за обработку данных 10 ГБ 0,016 USD 0,16 USD Промежуточная итоговая плата за продолжительность бессерверного получения логических выводов SageMaker по требованию = 40 USD. Промежуточная итоговая плата за обработку 10 ГБ данных = 0,16 USD. Итоговая плата для этого примера составит 40,16 USD.
Плата за вычисления за месяц
Количество запросов Продолжительность каждого запроса Общая продолжительность получения логических выводов (с) Цена за секунду Ежемесячная плата за продолжительность получения логических выводов 10 млн 100 мс 1 млн 0,00004 USD 40 USD
При бессерверном получении логических выводов по требованию платить нужно только за объем вычислительных ресурсов, использованных для обработки соответствующих запросов (плата начисляется по миллисекундам), и объем обработанных данных. Размер платы за вычисления зависит от выбранной вами конфигурации памяти.
Если вы выделили 2 ГБ памяти для своего адреса, запускали его 10 млн раз в течение месяца, он исполнялся каждый раз в течение 100 мс и обрабатывалось 10 ГБ входных и выходных данных в целом, размеры платы рассчитываются указанным далее образом.
-
Пример расчета стоимости 14. Provisioned Concurrency в бессерверных выводах
Предположим, вы используете сервис чат-бота для компании, занимающейся обработкой заработной платы. Вы ожидаете всплеска запросов клиентов в конце марта, до истечения срока подачи налоговых деклараций. Однако в оставшуюся часть месяца ожидается низкий трафик. Поэтому вы развертываете бессерверную конечную точку с 2 ГБ памяти и добавляете значение выделенного параллелизма 100 для отрезка времени с 9:00 до 17:00 (8 часов) последних 5 дней месяца, в течение которых конечная точка обрабатывает 10 млн запросов и в общей сложности 10 ГБ данных ввода-вывода. В остальное время чат-бот работает в режиме бессерверного получения логических выводов по запросу и обрабатывает 3 миллиона запросов и 3 ГБ данных ввода-вывода. Предположим, что продолжительность каждого запроса составляет 100 мс.
Стоимость использования Provisioned Concurrency (PC)
Цена ПК составляет 0,000010 USD за секунду
Продолжительность использования ПК (в секундах) = 5 дней * 100 ПК * 8 часов * 3600 секунд = 14 400 000 секунд
Плата за использование ПК = 14 400 000 секунд * 0,000010 USD/секунду = 144 USD.Плата за продолжительность логических выводов для трафика, обслуживаемого сервисом Provisioned Concurrency
Стоимость длительности вывода составляет 0,000023 USD/секунду
Общая продолжительность логического вывода для ПК (в секундах) = 10 м * (100 мс) / 1000 = 1 млн секунд.
Стоимость длительности вывода для ПК = 1 000 000 с * 0,000023 USD/секунду = 23 USDПлата за продолжительность получения логических выводов
Стоимость вычислений составляет 0,00004 USD/секунду; при этом 150 000 секунд в месяц предоставляются бесплатно.
Общее количество вычислений (в секундах) = (3) * (100 мс) / 1000 = 0,3 млн секунд.
Суммарные вычисления – вычисления в рамках бесплатного пользования = оплачиваемые вычисления в секундах
0,3 млн секунд – 150 000 секунд = 150 000 секунд
Ежемесячная стоимость вычислений = 150 000 * 0,00004 USD = 6 USDОбработка данных
Стоимость гигабайта обработанных и исходящих данных = 0,016 USD
Общее количество обработанных гигабайт = 10 + 3 = 13
Общая стоимость = 0,016 * 13 USD = 0,208 USD
Общая стоимость за март
Общая стоимость – это предусмотренная плата за параллельное выполнение запросов, продолжительность логических выводов при зарезервированном параллелизме и продолжительность логических выводов для вычислений по требованию, а также плата за обработку данных
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD -
Пример расчета стоимости №15. JumpStart
Клиент использует JumpStart для развертывания предварительно обученной базовой модели BERT без примеров для классификации эмоционального окраса отзывов клиентов как положительного или отрицательного.
Клиент развертывает модель на двух (2) инстансах ml.c5.xlarge для надежного хостинга нескольких зон доступности (AZ). Ежедневно модель принимает 100 МБ данных. Логические выводы занимают 1/10 объема входящих данных.
Часов в месяц Инстансы хостинга Стоимость в час Итого 24 x 31 x 2 = 1488 ml.c5.xlarge 0,204 USD 303,55 USD Принятые данные за месяц: хостинг Переданные данные за месяц: хостинг Цена за гигабайт входящих или исходящих данных
Итого
100 МБ * 31 = 3100 МБ 0,02 USD 0,06 USD 10 МБ * 31 = 310 МБ 0,02 USD 0,01 USD Промежуточная сумма за обучение, хостинг и мониторинг – 305 827 USD. Промежуточная сумма за 3100 МБ обработанных входящих данных и 310 МБ обработанных исходящих данных в месяц = 0,06 USD. Стоимость для этого примера составит 305,887 USD в месяц.
-
Пример расчета стоимости №16. Кластер HyperPod
Предположим, вы хотите предоставить кластер из 4 инстансов размером ml.g5.24xlarge на 1 месяц (30 дней) и дополнительно 100 ГБ хранилища на каждый инстанс для поддержки разработки моделей. Общая стоимость такого кластера с дополнительным хранилищем составит 29 374,40 USD.Вычисления
Инстанс Продолжительность Инстансы Стоимость в час Промежуточная сумма ml.g5.24xlarge 30 дней * 24 часа = 720 часов 4 10,18 USD 29 318,40 USD Хранилище
Универсальное хранилище (SSD) Продолжительность Инстансы Стоимость за ГБ в месяц Промежуточная сумма 100 ГБ 30 дней * 24 часа = 720 часов 4 0,14 USD 56,00 USD -
Пример расчета стоимости №17. Оценка базовых моделей (автоматическая)
При оценке базовых моделей с помощью SageMaker Clarify плата взимается только за экземпляры, используемые для выполнения заданий автоматической оценки. Вы выбираете задачу автоматической оценки и набор данных, а SageMaker загружает набор данных с запросами из Amazon S3 в инстанс для оценки SageMaker.
В следующем примере инженер машинного обучения оценивает модель Llama2 7B в регионе «Восток США (Северная Вирджиния)» на предмет точности задачи суммирования. Для модели Llama 2 7B рекомендуемым типом инстанса для вывода является ml.g5.2xlarge. Минимальный рекомендуемый инстанс для оценки – ml.m5.2xlarge. В этом примере задание выполняется в течение 45 минут (время зависит от размера набора данных). В этом примере стоимость задания по оценке и получения подробных результатов составит 1,48 USD.Часы работы задания по обработке (пример)
Регион
Тип инстанса
Инстанс
Стоимость в час
Цена:
0,45
US-east-1
Хостинг LLM
ml.g5.2xlarge
1,52 USD
1,14 USD
0,45
US-east-1
Оценка
ml.m5.2xlarge
0,46 USD
0,35 USD
Итого
1,48 USD
В следующем примере тот же инженер в штате Вирджиния выполняет еще одно задание по оценке точности задачи суммирования, но использует адаптированную версию Llama 2 7B, которая уже развернута и запущена в его аккаунте. В этом случае будет взиматься плата только за инстанс для оценки, поскольку сама модель уже развернута в аккаунте.
Часы работы задания по обработке
Регион
Тип инстанса
Инстанс
Стоимость в час
Цена:
0,45
US-east-1
Оценка
ml.m5.2xlarge
0,46 USD
0,35 USD
Итого
0,35 USD
-
Пример расчета стоимости №18. Оценка базовых моделей (с участием человека)
В следующем примере инженер по машинному обучению выполняет в регионе «Восток США (Северная Вирджиния)» оценку модели Llama-2-7B на предмет точности задач суммирования с участием человека, предоставив для такой оценки собственный персонал. Для модели Llama-2-7B рекомендуемым типом инстанса является ml.g5.2xlarge. Минимальный рекомендуемый экземпляр для задания по обработке с участием человека – ml.t3.medium. Вывод по модели Llama-2-7B выполняется в течение 45 минут (время зависит от размера набора данных). Набор данных содержит 50 запросов, а для оценки каждого набора запроса и ответа разработчик требует использовать 2-х сотрудников (это значение указывается в параметре «количество сотрудников на запрос» при создании задания по оценке). Это задание по оценке будет состоять из 100 задач (по 1 задаче на каждую пару «запрос – ответ» × 2 сотрудника × 50 наборов «запрос – ответ» = 100 задач для человека). Сотрудникам требуется примерно один день (24 часа), чтобы выполнить все 100 задач для человека, включенных в задание по оценке (реальное время зависит от количества и уровня квалификации сотрудников, а также длины и сложности запросов и ответов).
Часы вычислений
Задачи для человека
Регион
Тип инстанса
Инстанс
Стоимость в час
Стоимость выполнения каждой задачи для человека
Общая стоимость
0,45
Восток США (Сев. Вирджиния)
Хостинг LLM
ml.g5.2xlarge
1,52 USD
1,14 USD
24
Восток США (Сев. Вирджиния)
Задание по обработке
ml.t3.medium
0,05 USD
1,20 USD
100
Любой
0,21 USD
21,00 USD
Итого
23,34 USD
В следующем примере тот же инженер в штате Северная Вирджиния выполняет то же задание по оценке, но использует модель Llama-2-7B, уже установленную и работающую в его аккаунте. В этом случае плата будет взиматься только за обработку оценки и выполнение задач для человека.
Часы вычислений
Задачи для человека
Регион
Тип инстанса
Инстанс
Стоимость в час
Стоимость выполнения каждой задачи для человека
Общая стоимость
24
Восток США (Сев. Вирджиния)
Задание по обработке
ml.t3.medium
0,05 USD
1,20 USD
100
Любой
0,21 USD
21,00 USD
Итого
22,20 USD