Инстансы Amazon EC2 G7e теперь доступны в Азиатско-Тихоокеанском регионе (Токио)
С сегодняшнего дня инстансы Amazon EC2 типа G7e с ускорением на базе графических процессоров (GPU) NVIDIA RTX PRO 6000 Blackwell Server Edition доступны в Азиатско-Тихоокеанском регионе (Токио). Инстансы G7e способны обеспечить в 2,3 раза большую производительность логического вывода по сравнению с G6e.
Клиенты могут использовать инстансы G7e для развертывания больших языковых моделей (LLM), моделей агентного ИИ, мультимодальных моделей генеративного искусственного интеллекта и моделей физического ИИ. Инстансы G7e обеспечивают самую высокую производительность для рабочих нагрузок пространственных вычислений, а также нагрузок, требующих одновременной обработки графики и искусственного интеллекта. Инстансы G7e включают до восьми графических процессоров NVIDIA RTX PRO 6000 Blackwell Server Edition с 96 ГБ памяти на каждый и процессорами Intel Xeon пятого поколения. Они поддерживают до 192 виртуальных ЦП и пропускную способность сети до 1600 Гбит/с. Инстансы G7e поддерживают P2P-технологию NVIDIA GPUDirect, которая повышает производительность рабочих нагрузок с использованием множества GPU. Инстансы G7e с множеством GPU также поддерживают удаленный прямой доступ к памяти (RDMA) NVIDIA GPUDirect с интерфейсом EFA в EC2 UltraClusters, что уменьшает задержку для многоузловых рабочих нагрузок небольшого масштаба.
Использовать инстансы G7e для Amazon EC2 можно в следующих регионах AWS: Запад США (Орегон), Восток США (Северная Вирджиния, Огайо) и Азиатско-Тихоокеанский регион (Токио). G7e можно приобретать в качестве инстансов по требованию или спотовых инстансов либо в рамках Экономичных планов.
Чтобы начать с ними работу, вы можете воспользоваться Консолью управления AWS, Интерфейсом командной строки AWS (AWS CLI) и пакетами средств разработки ПО (SDK) AWS. См. дополнительные сведения об инстансах G7e.