- Amazon EC2›
- Типы инстансов›
- Инстансы P4
Инстансы Amazon EC2 P4
Высокая производительность для машинного обучения и приложений высокопроизводительных вычислений в облаке
Каковы преимущества инстансов Amazon EC2 P4?
Инстансы Amazon Elastic Compute Cloud (Amazon EC2) P4d обеспечивают высокую производительность приложений машинного обучения и высокопроизводительных вычислений в облаке. Инстансы P4d оснащены графическими процессорами NVIDIA A100 Tensor Core и обеспечивают лучшее в отрасли сетевое подключение с высокой пропускной способностью и малой задержкой. Эти инстансы поддерживают сеть инстансов со скоростью 400 Гбит/с. Инстансы P4d позволяют снизить затраты на обучение моделей МО до 60 %, включая повышение производительности моделей глубокого обучения в среднем в 2,5 раза по сравнению с инстансами P3 и P3dn предыдущего поколения.
Инстансы P4d развертываются в кластерах под названием Amazon EC2 UltraClusters, которые включают высокопроизводительные вычисления, сеть и хранилище в облаке. Каждый EC2 UltraCluster – один из самых мощных суперкомпьютеров в мире, помогающий выполнять самое сложное многоузловое машинное обучение и распределенные рабочие нагрузки для высокопроизводительных вычислений. Можно легко масштабировать графические процессоры NVIDIA A100 в EC2 UltraClusters от нескольких до тысяч в зависимости от потребностей вашего проекта в области машинного обучения или высокопроизводительных вычислений.
Исследователи, специалисты по обработке данных и разработчики могут использовать инстансы P4d для обучения моделей МО таким сценариям использования, как обработка естественного языка, обнаружение и классификация объектов, а также механизмы рекомендаций. Они также могут использовать его для запуска приложений высокопроизводительных вычислений, таких как открытие фармацевтических препаратов, сейсмический анализ и финансовое моделирование. В отличие от локальных систем, вы можете получить доступ к практически неограниченным вычислительным ресурсам и емкости хранилища, масштабировать инфраструктуру в соответствии с потребностями бизнеса и за считаные минуты запустить многоузловое задание по машинному обучению или создать тесно связанное распределенное приложение высокопроизводительных вычислений без каких-либо затрат на настройку или обслуживание.
Объявление о новых инстансах Amazon EC2 P4d
Преимущества
Благодаря графическим процессорам NVIDIA A100 Tensor Core последнего поколения каждый инстанс P4d обеспечивает в среднем в 2,5 раза лучшую производительность глубокого обучения по сравнению с инстансами P3 предыдущего поколения. Кластеры EC2 UltraClusters инстансов P4d помогают обычным разработчикам, специалистам по обработке данных и исследователям выполнять самые сложные рабочие нагрузки машинного обучения и высокопроизводительных вычислений, предоставляя доступ к производительности класса суперкомпьютера без предварительных затрат и долгосрочных обязательств. Сокращение времени обучения на инстансах P4d повышает производительность, помогая разработчикам сосредоточиться на своей основной задаче – внедрении самообучающегося ИИ в бизнес-приложения.
Разработчики могут легко масштабироваться до тысяч графических процессоров с помощью кластеров EC2 UltraClusters инстансов P4d. Высокопроизводительная сеть с малой задержкой и поддержкой сети инстансов 400 Гбит/с, Интерфейс эластичной матрицы (EFA) и технология GPUDirect RDMA помогают быстро обучать модели машинного обучения с использованием методов масштабирования или распределения. EFA использует NVIDIA Collective Communications Library (NCCL) для масштабирования до тысяч графических процессоров, а технология GPUDirect RDMA обеспечивает обмен данными графических процессоров между инстансами P4d с низкой задержкой.
Инстансы P4d дают возможность снизить затраты на обучение моделей машинного обучения на 60 % по сравнению с инстансами P3. Кроме того, инстансы P4d можно приобрести в виде спотовых инстансов. Спотовые инстансы задействуют неиспользуемые ресурсы инстансов EC2 и позволяют значительно снизить стоимость использования EC2, получив экономию до 90 % по сравнению с ценами на инстансы по требованию. Снижение стоимости на обучение моделей машинного обучения с использованием инстансов P4d дает возможность перераспределить расходы на внедрение в бизнес-приложения дополнительных интеллектуальных данных машинного обучения.
Глубокое обучение AWS AMI (DLAMI) и контейнеры Amazon Deep Learning упрощают развертывание сред P4d для глубокого обучения за считанные минуты, поскольку они содержат необходимые библиотеки и инструменты платформ глубокого обучения. Кроме того, к этим образам можно легко добавлять собственные библиотеки и инструменты. Инстансы P4d поддерживают популярные платформы машинного обучения, такие как TensorFlow, PyTorch и MXNet. Кроме того, инстансы P4d поддерживаются основными сервисами AWS для машинного обучения, управления и оркестрации, такими как Amazon SageMaker, Эластичный сервис Amazon Kubernetes (Amazon EKS), Amazon Elastic Container Service (Amazon ECS), Пакет AWS и AWS ParallelCluster.
Возможности
Графические процессоры NVIDIA A100 Tensor Core обеспечивают беспрецедентное масштабируемое ускорение машинного обучения и высокопроизводительных вычислений. Ядра NVIDIA A100 Tensor Core третьего поколения ускоряют выполнение любых прецизионных рабочих нагрузок, ускоряя получение аналитических данных и вывод продукта на рынок. Каждый графический процессор A100 обеспечивает большую вычислительную производительность – более чем в 2,5 раза – по сравнению с графическим процессором V100 предыдущего поколения и оснащен высокопроизводительной памятью графического процессора: 40 ГБ типа HBM2 (в инстансах P4d) и 80 ГБ типа HBM2e (в инстансах P4de). Больший объем памяти графического процессора особенно выгоден для тех рабочих нагрузок, которые связаны с обучением работе с большими наборами высокоточных данных. Графические процессоры NVIDIA A100 используют пропускную способность взаимодействия между графическими процессорами NVSwitch, поэтому каждый графический процессор может связываться с любым другим графическим процессором в том же инстансе при той же двунаправленной пропускной способности 600 ГБ/с с односкачковой задержкой.
Инстансы P4d обеспечивают сетевое подключение со скоростью 400 Гбит/с, что помогает клиентам лучше масштабировать распределенные рабочие нагрузки, такие как обучение работы с несколькими узлами, с помощью сети с высокой пропускной способностью между инстансами P4d, а также между инстансами P4d и сервисами хранилищ, такими как Amazon Simple Storage Service (Amazon S3) и FSx для Lustre. EFA – это пользовательский сетевой интерфейс, разработанный AWS для масштабирования приложений машинного обучения и высокопроизводительных вычислений на тысячах графических процессоров. Для большего снижения задержек интерфейс EFA сочетается с NVIDIA GPUDirect RDMA, обеспечивая обмен данными между серверами графических процессоров с низкой задержкой в обход ОС.
Получите доступ к хранилищу с высокой пропускной способностью и низкой задержкой в петабайтах с помощью FSx для Lustre или практически неограниченному экономичному хранилищу Amazon S3 со скоростью 400 Гбит/с. Для рабочих нагрузок, которым требуется быстрый доступ к большим наборам данных, каждый инстанс P4d также включает твердотельный накопитель на основе NVMe емкостью 8 ТБ с пропускной способностью чтения 16 Гбит/с.
Инстансы P4d основаны на сервисе AWS Nitro System, который предлагает широкий выбор структурных блоков и позволяет использовать выделенное оборудование и программное обеспечение для выполнения многих традиционных задач виртуализации, что повышает производительность, доступность и безопасность при одновременном сокращении издержек, связанных с виртуализацией.
Отзывы клиентов
Здесь представлены несколько примеров того, как наши клиенты и партнеры достигли бизнес-целей с помощью инстансов Amazon EC2 P4.
Toyota Research Institute (TRI)
ТРИ ОБЪЯВЛЕНИЯ
ТРИ ОБЪЯВЛЕНИЯ
GE Healthcare
HEAVY.AI
ООО «Зенотех»
Aon
Дорожный искусственный интеллект
Сведения о продукте
|
Размер инстанса
|
Виртуальные ЦПУ
|
Память инстанса (ГиБ)
|
Графический процессор – A100
|
Память графического процессора
|
Пропускная способность сети (Гбит/с)
|
GPUDirect RDMA
|
Одноранговая связь графических процессоров
|
Хранилище инстансов (ГБ)
|
Пропускная способность EBS (Гбит/с)
|
|---|---|---|---|---|---|---|---|---|---|
|
p4d.24xlarge
|
96
|
1152
|
8
|
320 ГБ
HBM2 |
400 ENA и EFA
|
Да
|
NVSwitch 600 ГБ/с
|
8 × 1000 SSD на базе NVMe
|
19
|
|
p4de.24xlarge
|
96
|
1152
|
8
|
640 ГБ
HBM2e |
400 ENA и EFA
|
Да
|
NVSwitch 600 ГБ/с
|
8 × 1000 SSD на базе NVMe
|
19
|
Начало работы с инстансами P4d для машинного обучения
Amazon SageMaker — это полностью управляемый сервис для создания, обучения и развертывания моделей машинного обучения. При использовании этого сервиса совместно с инстансами P4d клиенты могут просто выполнять масштабирование рабочих нагрузок на десятки, сотни и тысячи графических процессоров для быстрого обучения моделей в любом масштабе, не беспокоясь о настройке кластеров и конвейеров обработки данных.
DLAMI предоставляет специалистам по машинному обучению и исследователям инфраструктуру и инструменты для ускорения DL в облаке в любом масштабе. Контейнеры глубокого обучения — это образы Docker, предустановленные вместе с фреймворками DL, которые упрощают быстрое развертывание пользовательских сред машинного обучения и позволяют избежать сложного процесса создания и оптимизации сред с нуля.
Начало работы с инстансами P4d для высокопроизводительных вычислений
Инстансы P4d идеально подходят для инженерного моделирования, финансовых вычислений, сейсмического анализа, молекулярного моделирования, геномики, рендеринга и прочих рабочих нагрузок высокопроизводительных вычислений, требующих наличия графического процессора. Для работы HPC‑приложений часто требуется высокая производительность сети, хранилище с высокой скоростью чтения и записи, большая емкость памяти, огромные вычислительные мощности либо все эти ресурсы одновременно. Инстансы P4d поддерживают EFA, что позволяет HPC‑приложениям, использующим интерфейс передачи сообщений (MPI), масштабироваться до тысяч графических процессоров. Пакет AWS и AWS ParallelCluster помогают разработчикам высокопроизводительных вычислений быстро создавать и масштабировать распределенные приложения для высокопроизводительных вычислений.