Объявление об общедоступных инстансах Amazon EC2 P5e в блоках ресурсов EC2
Сегодня AWS представляет общедоступные инстансы Amazon Elastic Compute Cloud (Amazon EC2) типа P5e на базе новейших графических процессоров NVIDIA H200 Tensor Core. Эти инстансы, доступные в блоках ресурсов EC2, обеспечивают самую высокую производительность в Amazon EC2 для глубокого обучения и логического вывода на основе генеративного искусственного интеллекта.
Инстансы Amazon EC2 P5e можно использовать для обучения и развертывания все более сложных больших языковых моделей (LLM) и моделей диффузии, лежащих в основе самых требовательных приложений генеративного искусственного интеллекта. Кроме того, инстансы P5e позволяют развертывать ресурсоемкие приложения высокопроизводительных вычислений (HPC) в необходимом масштабе для фармацевтических исследований, анализа сейсмостойкости, прогноза погоды и финансового моделирования.
Инстансы P5e содержат 8 графических процессоров H200, которые имеют в 1,7 раза больший объем и в 1,5 раза более высокую пропускную способность памяти по сравнению с процессорами H100, используемыми в инстансах P5. Они предоставляют лучшие на рынке возможности горизонтального масштабирования для распределенного обучения и тесно связанных рабочих нагрузок HPC за счет сетевого подключения со скоростью до 3200 Гбит/с на основе технологии Интерфейса эластичной матрицы (EFA) второго поколения. Чтобы обеспечить заказчикам необходимый масштаб и низкую задержку, инстансы P5e развертываются в кластерах Amazon EC2 UltraClusters.
Инстансы P5e теперь доступны в регионе AWS Восток США (Огайо) с размерами p5e.48xlarge в блоках ресурсов EC2 для машинного обучения.
Подробнее о них см. раздел Инстансы Amazon EC2 P5e.