Перейти к главному контенту

Amazon EC2

Инстансы Amazon EC2 G4

Самые экономичные в отрасли инстансы на базе графических процессоров для логического вывода на базе машинного обучения и приложений с интенсивным использованием графики

Какие преимущества дают инстансы Amazon EC2 G4?

Инстансы Amazon EC2 G4 – это самые экономичные и универсальные в отрасли инстансы с графическими процессорами для развертывания моделей машинного обучения, предназначенных для классификации изображений, обнаружения объектов и распознавания речи, а также для ресурсоемких графических приложений, таких как удаленные графические рабочие станции, потоковая передача игр и рендеринг графики. Инстансы G4 предлагаются с разными графическими процессорами NVIDIA (G4dn) или AMD (G4ad).

Инстансы G4dn оснащены графическими процессорами NVIDIA T4 и специальными процессорами Intel Cascade Lake, а также оптимизированы для выполнения машинного обучения в небольших масштабах и логического вывода. Эти инстансы обеспечивают высокую производительность для приложений с интенсивным использованием графики, например удаленных рабочих станций, потоковой передачи игр и рендеринга графики. Эти инстансы также идеально подходят для тех клиентов, которые предпочитают использовать программное обеспечение NVIDIA, в том числе виртуальную рабочую станцию RTX или библиотеки CUDA, CuDNN и NVENC.

Инстансы G4ad оснащены новейшими графическими процессорами AMD Radeon Pro V520 и процессорами AMD EPYC второго поколения. Эти инстансы обеспечивают наилучшее соотношение цены и производительности среди всех облачных предложений для графических приложений, таких как удаленные рабочие станции, потоковая передача игр и рендеринг графики. По сравнению с другими инстансами аналогичного уровня они обеспечивают на 45 % лучшее соотношение цены и производительности для приложений с интенсивным использованием графики.

Новые инстансы Amazon EC2 G4ad

Инстансы Amazon EC2 G4dn

Инстансы G4dn на базе графических процессоров NVIDIA T4 – это самые недорогие в облаке инстансы на базе графических процессоров, предназначенные для машинного обучения в небольших масштабах и получения логических выводов. Они также обеспечивают высокую производительность и являются экономичным решением для графических приложений, оптимизированных для использования графических процессоров NVIDIA с библиотеками NVIDIA, таких как CUDA, CuDNN или NVENC. Они могут иметь до 8 графических процессоров NVIDIA T4, до 96 виртуальных процессоров, сетевое подключение до 100 Гбит/с и локальный твердотельный накопитель на базе NVMe емкостью до 1,8 ТБ. Предлагается также вариант инстансов без операционной системы.

Преимущества G4dn

    Инстансы G4dn оснащены графическими процессорами NVIDIA T4, которые обеспечивают в 40 раз более высокую пропускную способность (с низкой задержкой) по сравнению с центральными процессорами, что позволяет обслуживать больше запросов в режиме реального времени. Кроме того, инстансы G4dn оптимизированы таким образом, чтобы с наименьшими затратами предоставлять логический вывод на базе машинного обучения, поскольку эта статья расходов может составлять до 90 % всех эксплуатационных расходов в проектах машинного обучения.

    Инстансы G4dn также пригодны для заданий обучения моделей машинного обучения небольшого или стартового уровня, если для предприятия или учреждения не очень важна скорость обучения. Инстансы G4dn обеспечивают производительность до 65 терафлопс для типа данных FP16 и являются отличным решением для небольших задач обучения.

    Инстансы G4dn обеспечивают производительность графических вычислений до 1,8 раз выше и возможность транскодирования видео до 2 раз выше по сравнению с инстансами G3 предыдущего поколения. Клиенты могут настроить виртуальные рабочие станции с доступом к рабочим станциям NVIDIA RTX без дополнительной оплаты.

Характеристики G4dn

    Графические процессоры NVIDIA T4 ускоряют выполнение разнообразных облачных рабочих нагрузок, включая процессы обучения и логического вывода на базе глубокого обучения, а также графические вычисления. Графические процессоры T4, основанные на новой архитектуре NVIDIA Turing, оснащены высокоточными ядрами Turing Tensor Cores и новыми ядрами RT. Технология Turing Tensor Core с мультипрецизионными вычислениями для машинного обучения обеспечивает непревзойденную производительность для типов данных FP32, FP16, INT8 и INT4. Она обеспечивает до 9,3 раза более высокую производительность по сравнению с традиционными процессорами для задач обучения, и до 36 раз – для задач логического вывода.

    Инстансы G4dn обеспечивают скорость сети до 100 Гбит/с для приложений, которым важна высокая пропускная способность. Кроме того, инстансы G4dn поддерживают интерфейс эластичной матрицы (EFA), который позволяет клиентам в большом масштабе запускать приложения с интенсивным взаимодействием между узлами. Эти инстансы предоставляют твердотельный накопитель на базе NVMe емкостью до 1,8 ТБ для приложений, которым важен быстрый доступ к локально хранящимся данным.

    Инстансы G4dn без дополнительной оплаты предоставляют клиентам драйверы RTX и игровые драйверы NVIDIA. Драйверы RTX позволяют создавать высококачественные виртуальные рабочие станции для широкого спектра рабочих потоков с интенсивным использованием визуальной информации. Игровые драйверы обеспечивают непревзойденную графическую и вычислительную поддержку для разработки игр.

Инстансы G4ad Amazon EC2

Инстансы G4ad на основе графических процессоров AMD Radeon Pro V520 предлагают наилучшее сочетание цены и производительности для приложений с интенсивным использованием графики в облаке. У этих инстансов соотношение цены и производительности на 45 % лучше, чем у инстансов G4dn, которые до этого момента были самыми дешевыми инстансами в облаке, предназначенными для приложений с использованием графики, таких как удаленные графические рабочие станции, потоковое вещание игр и рендеринг графики, с поддержкой стандартных отраслевых API, например OpenGL, DirectX и Vulkan. Они содержат до 4 графических процессоров AMD Radeon Pro V520, 64 виртуальных ЦПУ, сеть 25 Гбит/с и локальный SSD на базе NVMe емкостью 2,4 ТБ.

Преимущества G4ad

    Инстансы G4ad – это самые экономичные инстансы в облаке для приложений с интенсивным использованием графики. Соотношение цены и производительности у них на 45 % лучше, а производительность графических вычислений на 40 % выше, чем у любых сопоставимых инстансов для приложений с использованием графики, таких как удаленные графические рабочие станции, потоковое вещание игр и рендеринг графики, с поддержкой стандартных отраслевых API, например OpenGL, DirectX и Vulkan.

    Инстансы G4ad позволяют клиентам за считаные минуты настраивать виртуальные рабочие станции с возможностями для высокопроизводительного моделирования, визуализации и проектирования, чтобы клиенты могли быстро масштабировать свои системы. Клиенты могут использовать AMD Radeon Pro Software for Enterprise и высокопроизводительный протокол удаленного отображения NICE DCV в сочетании с инстансами G4ad без дополнительных затрат на управление средами виртуальных рабочих станций с поддержкой двух мониторов с разрешением 4К на каждый графический процессор.

    Профессиональное графическое решение AMD включает процесс тщательного тестирования и сертификации приложений вендоров ПО (ISV), известный под названием Day Zero Certification Program. Он позволяет убедиться, что разработчики с первого же дня выпуска драйвера используют самые новые функции AMD Radeon Pro Software for Enterprise в сочетании с надежностью сертифицированного программного обеспечения.

Характеристики G4ad

    Графические процессоры AMD Radeon Pro V520 обеспечивают высокую производительность графических вычислений для таких задач, как виртуальные рабочие станции, компьютерная генерация изображений (CGI), потоковая передача игр и создание цифрового контента (DCC). Эти графические процессоры основаны на сверхэффективной архитектуре AMD RDNA, которая отличается низкой задержкой и высокой скоростью передачи данных между центральными и графическими процессорами, что важно для обеспечения высокого качества взаимодействия с рабочими станциями и играми. Архитектура RDNA получила улучшенный графическому конвейер, чтобы игры обрабатывались быстрее и производительность повышалась.

    Инстансы G4ad предоставляют локальное хранилище NVMe емкостью до 2,4 ТБ, обеспечивая быстрый доступ к данным, что позволяет клиентам эффективно создавать фотореалистичный трехмерный контент высокого разрешения для фильмов, игр, дополненной и виртуальной реальности.

    Инстансы G4ad предоставляют графические драйверы профессионального уровня без дополнительной оплаты. Эти драйверы можно использовать для оптимизации работы виртуальной рабочей станции при выполнении широкого спектра рабочих процессов с высокой нагрузкой на графическую систему. Кроме того, они обеспечивают непревзойденную поддержку графических и традиционных вычислений при разработке игр.

Отзывы клиентов и партнеров

Здесь представлено несколько примеров того, как наши клиенты и партнеры достигли бизнес-целей с помощью инстансов Amazon EC2 G4.

Ubitus

Инновационная компания Ubitus считается лидером в создании облачных игровых технологий. На платформах этой компании пользователи могут наслаждаться играми класса AAA на любом устройстве, включая смартфоны, планшеты, игровые консоли, смарт-телевизоры и компьютеры. Нужно лишь широкополосное подключение к сети.

«Компания Ubitus использовала возможности графических процессоров на AWS, чтобы в сотрудничестве с IO Interactive выпустить облачную версию Hitman 3 для портативного игрового устройства. С появлением инстансов Amazon EC2 G4ad мы смогли разместить на 50 % больше параллельных потоков на каждый инстанс без изменения кода, что помогло нам оптимизировать затраты. Более дешевая структура позволяет нам предложить геймерам по всему миру больше новых игр, таких как Hitman 3», –

Уэсли Куо, генеральный директор Ubitus

Missing alt text value

Land F/X

«Компания Land F/X использует ускорение на графических процессорах, чтобы помочь специалистам по проектированию максимально увеличить соотношение производительности и затрат. Компания Land F/X использовала инстансы G4dn при разработке, а при появлении G4ad ей удалось быстро перейти на них, повысив производительность рендеринга на 67 % и снизив затраты на 25 % по сравнению с использовавшимся ранее графическим процессором», –

Джеремайя Фармер, генеральный директор и разработчик, компания Land F/X

Missing alt text value

Duolingo

Duolingo – это бесплатная образовательная платформа, которая стала самым популярным способом онлайн-изучения языков. Лингвисты, инженеры по машинному обучению и специалисты по искусственному интеллекту Duolingo используют данные более 300 миллионов учащихся для постоянного повышения эффективности платформы.

«По мере роста наших отделов машинного обучения и исследования мы решили обновить существующую вычислительную инфраструктуру на базе Amazon ECS, включив в нее инстансы Amazon EC2 P3 и G4 на базе графических процессоров, чтобы лучше масштабировать нашу модель разработки. Оптимизированные образы Amazon ECS AMI для инстансов с графическим процессорами помогли нам очень быстро запустить новый кластер. Мы обнаружили, что инстансы G4 удвоили скорость задач по машинному обучению по сравнению с инстансами P2, что позволило сократить расходы на 33 %. Инстансы P3 увеличили производительность еще в четыре раза и снизили затраты на 15 %. В целом, инстансы G4 подходят для наших типичных сценариев использования, поскольку обеспечивают хорошее соотношение стоимости и производительности, а инстансы P3 идеальны для тех случаев, когда дополнительная скорость критически важна для конкретной рабочей нагрузки», –

Макс Блейз, штатный инженер по эксплуатации в Duolingo

Missing alt text value

Blacknut

«Ведущий независимый сервис облачных игр Blacknut предоставляет широкой публике возможность играть на любом устройстве в режиме “нажми и играй” в любую из более 500 видеоигр, выбирая их из каталога. Чтобы выполнить поставленную задачу (низкие задержки, быстрая загрузка и отзывчивый игровой интерфейс), нам было важно находиться как можно ближе к игрокам. С помощью инстансов EC2 G4dn мы можем обеспечить игрокам среднее время загрузки игры не более 10 секунд, что гарантирует положительные впечатления. Мы также можем выводить наше решение на новые рынки менее чем за 2 месяца, и такая оперативность позволила нам ежемесячно, начиная с 2020 года, привлекать новых глобальных партнеров, в числе которых Telecom Italia, Swisscom, POST, Drei Austria и Ais (Таиланд). Сейчас наш сервис доступен более чем на 40 рынках», –

Паскаль Маншон, технический директор Blacknut

Missing alt text value

Snap

В 2018 году компания Snap Inc. (Snap), известная своим приложением Snapchat для обмена сообщениями, решила реализовать новую интересную идею: создать серию анимационных видеороликов с участием мультяшного аватара Bitmoji, который персонализируется для каждого пользователя – это фирменная фишка приложения Snapchat. Каждую неделю на Bitmoji TV выходили новые серии продолжительностью от 3 до 8 минут с непритязательным содержанием, написанные и анимированные профессионалами. В этих видео главную роль играли Bitmoji конкретного пользователя и его друзей: иногда им предстояло победить зомби, а в другой раз – принять участие в «Лунлимпийских играх» в условиях низкой гравитации. С помощью инстансов Amazon EC2 G4 компания Snap смогла создать увлекательное и смелое персонализированное развлечение, которое можно создавать одновременно для миллионов пользователей при невысоких затратах на вычислительные ресурсы.

«При использовании инстансов Amazon EC2 G4 мы получили прирост производительности на 50 % по сравнению с инстансами Amazon EC2 G3, а затраты увеличились всего на 10 %», –

Брэд Коцопулос, инженер ПО, Snap Inc.

Missing alt text value

Nearmap

Компания Nearmap была основана в Перте, Австралия, в 2007 году, и из небольшого стартапа превратилась в лидера в области цифровой обработки изображений. Компания специализируется на создании двухмерных и трехмерных изображений ландшафтов на основе аэрофотоснимков, что очень востребовано в самых разных отраслях. Для компании Nearmap переход на инстансы Amazon EC2 G4 принес немедленный и ощутимый эффект. Они смогли за те же деньги обрабатывать в три раза больше данных, чем ранее на инстансах Amazon EC2 G2. Переход оказался очень простым и интеграция с уже используемыми инструментами AWS не доставила ни малейших проблем.

«Наши клиенты рассчитывают на то, что мы предоставляем высокоточные 3D-модели реальности, рассчитанные на основе многоугольной аэрофотосъемки в больших зонах покрытия. Мы используем около 870 тысяч ядер графических процессоров каждый день. Раньше мы запускали этот конвейер на инстансах Amazon EC2 G2, но потом перешли на инстансы Amazon EC2 G4 и снизили затраты на 67 %», –

Джон Корбетт, директор по системам машинного зрения

Missing alt text value

Untold Studios

Untold Studios развернула несколько конфигураций виртуальных рабочих станций AWS, в том числе на инстансах G4 с графическими процессорами NVIDIA T4 и технологией RTX, оптимизированные для рабочих процессов обработки визуальных эффектов и анимации. Благодаря широкому выбору инстансов компания Untold Studios смогла очень точно сопоставить типы виртуальных машин с конкретными рабочими нагрузками, что очень полезно и для творчества, и для бюджета. 

«G4 оказали огромное влияние на нашу работу. Мы можем одной строкой кода модернизировать целый парк рабочих станций, чтобы художники могли работать быстрее и развивать творческий потенциал во всем, что мы делаем», –

Сэм Рид, руководитель отдела технологий, Untold Studios

Missing alt text value

Hive VFX

Рабочие станции изначально были развернуты с использованием инстансов Amazon Elastic Compute Cloud (Amazon EC2) G3. Но когда появились инстансы Amazon EC2 G4 на базе графических процессоров NVIDIA T4 Tensor Core (это новейшее поколение графических процессоров NVIDIA) с поддержкой самой современной технологии NVIDIA RTX для высокопроизводительного моделирования, рендеринга и проектирования, Hive VFX смогла легко и быстро обновить систему. 

«Переход с G3 на G4 прошел очень легко, и уже через несколько минут наши художники получили доступ к графическим процессорам NVIDIA нового поколения с самыми инновационными технологиями для поддержки компьютерной графики и повышения производительности. Производительность рабочих станций, которые мы получаем на инстансах G4, превосходит даже возможности некоторых крупных студий. Этого более чем достаточно для удовлетворения наших потребностей», –

Берни Кимбахер, основатель Hive VFX

Missing alt text value

Humen

В рекламном ролике Doritos, посвященном Суперкубку 2020 года, был показан танец 75-летнего актера Сэма Эллиотта с 21-летним рэпером Lil Nas X. Этот танцевальный батл стал возможным благодаря технологии искусственного интеллекта, разработанной стартапом Humen в рамках проекта Sway. Эта небольшая компания смогла заключить партнерское соглашение с мегакорпорацией Doritos в рамках кампании по поддержке Суперкубка. Ее приложение Sway стало лидером продаж в App Store, не без поддержки платформы Amazon Web Services (AWS). Чтобы справиться с колоссальной нагрузкой по запуску приложения с интенсивным использованием графики во время проведения Суперкубка, компания Humen применила инстансы Amazon Elastic Compute Cloud (Amazon EC2) G4, которые помогли добиться превосходных результатов.

«Благодаря инстансам Amazon EC2 G4 мне удалось примерно за 6 месяцев сделать Sway способным справляться с масштабами Суперкубка», –

Джесси Майерс, инженер, Humen

Missing alt text value

The Molecule

«Программное обеспечение для визуальных эффектов требует все больше мощности графического процессора. Она очень важна, когда используется, но зато используется не каждый день. Наше предприятие относится к малому бизнесу, и нам не по карману гоночный автомобиль для поездок за продуктами. Мы не можем себе позволить купить какую-то штуку, которую используем только изредка. И уж тем более мы не можем купить 10 таких штук для одного проекта с уникальными требованиями. Но благодаря инстансам G4 мы получили доступ к целому парку гоночных автомобилей с поддержкой графических процессоров, которые работают лучше и быстрее всех штук, которые мы могли бы купить, и за них нам не нужно платить, когда они не используются. Наши творческие сотрудники очень рады, что могут использовать гоночные машины, а мы еще больше рады, что можем их вернуть, когда они нам не нужны!» –

Крис Хилер, президент компании The Molecule

Missing alt text value

PureWeb

«Компания PureWeb стремится предоставить предприятиям лучшую в мире платформу для потоковой передачи интерактивного контента в режиме реальном времени. Когда Женевский международный автосалон был отменен из-за пандемии COVID-19, компания Volkswagen обратилась к нам с инновационной идеей – создать для клиентов виртуальный шоурум, который поможет смягчить проблемы, вызванные этой отменой. В тесном сотрудничестве с AWS и креативным агентствами мы смогли всего за три недели создать виртуальную копию шоурума на базе Unity Game Engine, который выполнялся на оборудовании инстансов Amazon EC2 G4dn. В результате тысячи пользователей смогли посетить стенд Volkswagen на Женевском автосалоне, даже не выходя из дома. Учитывая ограничения по времени и технические ограничения, мы уверены, что среди всех поставщиков облачных услуг только AWS подходит для решения поставленной задачи, обеспечивая стабильное, масштабируемое, экономичное и поистине глобальное взаимодействие с пользователями», –

Крис Джарабек, старший архитектор программного обеспечения, компания PureWeb

Missing alt text value

G4dn

Размер инстанса
Графический процессор
Виртуальные ЦПУ
Память (ГиБ)
Хранилище инстансов (ГБ)
Пропускная способность сети (Гбит/с)
Пропускная способность EBS (Гбит/с)
ВМ с одним графическим процессором
g4dn.xlarge

g4dn.2xlarge

g4dn.4xlarge

g4dn.8xlarge

g4dn.16xlarge

1

1

1

1

1

4

8

16

32

64

16

32

64

128

256

1 x 125 SSD на базе NVMe

1 × 225 SSD на базе NVMe

1 × 225 SSD на базе NVMe

1 × 900 SSD на базе NVMe

1 × 900 SSD на базе NVMe

До 25

До 25

До 25

50

50

До 3,5

До 3,5

4,75

9,5

9,5

ВМ с несколькими графическими процессорами

g4dn.12xlarge

g4dn.metal

4

8

48

96

192

384

1 × 900 SSD на базе NVMe

2 × 900 SSD на базе NVMe

50

100

9,5

19

G4ad

Размер инстанса
Графический процессор
Виртуальные ЦПУ
Память (ГиБ)
Хранилище инстансов (ГБ)
Пропускная способность сети (Гбит/с)
Пропускная способность EBS (Гбит/с)
Цена по требованию за час*
Инстанс, зарезервированный на 1 год; фактический почасовой тариф* (Linux)
Инстанс, зарезервированный на 3 года; фактический почасовой тариф* (Linux)
ВМ с одним графическим процессором

g4ad.xlarge

g4ad.2xlarge

g4ad.4xlarge

1

1

1

4

8

16

16

32

64

1 × 150 SSD на базе NVMe

1 × 300 SSD на базе NVMe

1 × 600 SSD на базе NVMe

До 10

До 10

До 10

До 3

До 3

До 3

0,379 USD

0,541 USD

0,867 USD

0,227 USD

0,325 USD

0,520 USD

0,178 USD

0,254 USD

0,405 USD

ВМ с несколькими графическими процессорами

g4ad.8xlarge

g4ad.16xlarge

2

4

32

64

128

256

1 × 1200 SSD на базе NVMe

1 × 2400 SSD на базе NVMe

15

25

3

6

1,734 USD

3,468 USD

1,040 USD

2,081 USD

0,810 USD

1,619 USD

* Цены указаны для региона AWS Восток США (Северная Вирджиния). Цены, указанные для инстансов, зарезервированных на 1 и 3 года, действительны при выборе способа оплаты с частичной предоплатой или без предоплаты (для инстансов, не предусматривающих возможности частичной предоплаты).

Начать работу с инстансами G4dn

Использование готовых AMI и контейнеров AWS

Благодаря использованию AMI для глубокого обучения Amazon или контейнеров для глубокого обучения AWS вы можете быстро запускать инстансы Amazon EC2 с предварительно установленными популярными платформами и интерфейсами глубокого обучения, такими как TensorFlow и PyTorch, что позволяет обучать сложные специализированные модели искусственного интеллекта, экспериментировать с новыми алгоритмами или изучать новые навыки и методы. Чтобы получить больше информации, посетите страницу продукта «AMI для глубокого обучения Amazon» или страницу продукта «Контейнеры для глубокого обучения AWS».

Создание собственного пользовательского AMI с драйверами NVIDIA

Драйверы центра обработки данных NVIDIA обеспечивают наилучшую производительность высокоинтенсивных вычислительных рабочих нагрузок, которые часто применяются для задач глубокого обучения, анализа данных и высокопроизводительных вычислений.

Драйверы NVIDIA RTX можно использовать для поддержки программного обеспечения виртуальной рабочей станции NVIDIA RTX. RTX vWS поддерживает до четырех дисплеев с разрешением 4K на каждый графический процессор. Драйверы NVIDIA Gaming поддерживают самые передовые в мире видеокарты, игровые решения и технологии. Этот драйвер обеспечивает поддержку одного дисплея с разрешением 4K на каждый графический процессор.

Чтобы узнать, как установить эти драйверы на свой инстанс, перейдите по ссылкам с инструкциями для операционных систем Linux и Windows.

Начать работу с инстансами G4ad

Использование предварительно созданных AMI от AWS

Драйверы AMD Radeon Pro Software for Enterprise обеспечивают высокопроизводительные графические вычисления для виртуальных рабочих станций, потоковой передачи игр, рендеринга графики и других графических приложений. Чтобы быстро начать работу, вы можете использовать AMI, предоставленные компанией AWS, которые содержат предустановленные драйверы AMD Radeon Pro Software for Enterprise. Эти AMI доступны на торговой площадке AMD Radeon Pro.

Создание собственного пользовательского AMI с драйверами AMD

Драйверы AMD Radeon Pro Software for Enterprise позволяют настроить для инстансов мощную и надежную графическую систему профессионального уровня. Рабочие станции с этими драйверами могут поддерживать до двух дисплеев с разрешением 4K.

Сведения о том, как установить эти драйверы на инстанс для создания собственного AMI, предоставлены по ссылкам с инструкциями для операционных систем Linux и Windows.