Инстансы Amazon EC2 типа Inf2 теперь доступны в Корее

Проведено: 7 мая 2025 г.

С сегодняшнего дня инстансы Amazon Elastic Compute Cloud (Amazon EC2) типа Inf2, оптимизированные для генеративного искусственного интеллекта, являются общедоступными для Азиатско-Тихоокеанского региона AWS (Сеул). Инстансы Amazon EC2 типа Inf2 позволяют снизить затраты на логический вывод на 40 % по сравнению с сопоставимыми инстансами Amazon EC2.

Инстансы Inf2 можно использовать для резюмирования текста, генерации кода, видео и изображений, распознавания речи, персонализации и других распространенных задач. В инстансах Inf2, оптимизированных для логического вывода, впервые в Amazon EC2 представлен масштабируемый распределенный вывод, поддерживаемый высокоскоростным неблокирующим соединением NeuronLink. Они обеспечивают производительность до 2,3 петафлоп и поддерживают до 384 ГБ общей памяти ускорителя с пропускной способностью 9,8 ТБ/с.

Пакет средств разработки ПО (SDK) AWS Neuron обеспечивает готовую интеграцию с популярными платформами машинного обучения, позволяя вам продолжать использовать уже имеющиеся платформы, развернув их на Inf2. Разработчики могут начать работу с инстансами Inf2, используя образы машин Amazon (AMI) или контейнеры для глубокого обучения AWS, а также управляемые сервисы, такие как Amazon Elastic Container Service (Amazon ECS), Эластичный сервис Amazon Kubernetes (Amazon EKS) и Amazon SageMaker.

Инстансы Inf2 сейчас доступны в четырех размерах (inf2.xlarge, inf2.8xlarge, inf2.24xlarge и inf2.48xlarge) в 14 регионах AWS в виде инстансов по требованию, зарезервированных инстансов и спотовых инстансов или в рамках экономичных планов.

Подробнее об инстансах Inf2 см. на веб-странице инстансов Amazon EC2 типа Inf2 и в документации AWS Neuron.