Annonce de la disponibilité générale des instances Amazon EC2 G6e

Publié le: 15 août 2024

Nous annonçons aujourd'hui la disponibilité générale des instances Amazon EC2 G6e à technologie GPU NVIDIA L40S Tensor Core. Les instances G6e peuvent être utilisées pour un large éventail de cas d'utilisation du machine learning et de l'informatique spatiale. Les instances G6e offrent des performances jusqu'à 2,5 fois supérieures à celles des instances G5, et des coûts d'inférence jusqu'à 20 % inférieurs à ceux des instances P4d.

Les clients peuvent utiliser les instances G6e pour déployer de grands modèles de langage (LLM) avec jusqu'à 13 octets de paramètres et des modèles de diffusion pour générer des images, des vidéos et du son. En outre, les instances G6e vont permettre aux clients de créer des simulations 3D plus grandes et plus immersives, ainsi que des jumeaux numériques pour les charges de travail de l’informatique spatiale. Les instances G6e comportent jusqu'à 8 GPU NVIDIA L40S Tensor Core avec 384 Go de mémoire totale (48 Go de mémoire par GPU) et des processeurs AMD EPYC de 3e génération. Elles prennent également en charge jusqu'à 192 vCPU, jusqu'à 400 Gb/s de bande passante du réseau, jusqu’à 1 536 To de mémoire système, et jusqu'à 7,6 To de stockage local SSD NVMe. Les développeurs peuvent exécuter des charges de travail d'inférence d'IA sur des instances G6e à l'aide des AMI AWS Deep Learning, des conteneurs AWS Deep Learning ou des services gérés tels qu'Amazon Elastic Kubernetes Service (Amazon EKS) et AWS Batch, le support Amazon SageMaker étant bientôt disponible.

Les instances Amazon EC2 G6e sont disponibles dès aujourd'hui dans les régions AWS USA Est (Virginie du Nord et Ohio) et USA Ouest (Oregon). Les clients peuvent acheter des instances G6e sous forme d'instances à la demande, réservées, Spot ou dans le cadre de Savings Plans.

Pour commencer, accédez à la console de gestion AWS, à l'interface de la ligne de commande AWS (AWS CLI) et aux kits SDK AWS. Pour en savoir plus, consultez la page dédiée aux instances G6e.