Publié le: Aug 9, 2023

À compter d'aujourd'hui, les instances Amazon Elastic Compute Cloud (Amazon EC2) Inf2 sont disponibles dans la région USA Ouest (Oregon). Ces instances offrent des performances élevées à moindre coût dans Amazon EC2 pour les modèles d'IA générative.

Vous pouvez utiliser les instances Inf2 pour exécuter des applications courantes telles que la génération de codes, de vidéos et d'images, ou encore la synthèse de texte, la reconnaissance vocale, la personnalisation, etc. Les instances Inf2 optimisées dans Amazon EC2 sont les premières à intégrer une inférence distribuée évolutive prise en charge par NeuronLink, une interconnexion haut débit et non bloquante. Les instances Inf2 offrent jusqu'à 2,3 pétaflops et jusqu'à 384 Go de mémoire d'accélérateur totale avec une bande passante de 9,8 To/s. Les instances Inf2 offrent des performances tarifaires jusqu'à 40 % supérieures à celles des autres instances Amazon EC2 comparables. 

Le SDK AWS Neuron s'intègre de manière native aux cadres de machine learning les plus courants, afin que vous puissiez continuer à utiliser vos cadres existants pour les déployer sur Inf2. Les développeurs peuvent commencer à utiliser des instances Inf2 à l'aide des AMI AWS Deep Learning, des conteneurs AWS Deep Learning ou des services gérés tels que Amazon Elastic Container Service (Amazon ECS), Amazon Elastic Kubernetes Service (Amazon EKS) et Amazon SageMaker.

Les instances Inf2 sont disponibles en quatre tailles : inf2.xlarge, inf2.8xlarge, inf2.24xlarge, inf2.48xlarge. Elles sont proposées sous forme d'instances à la demande, d'instances réservées et d'instances Spot, ou dans le cadre d'un plan d'épargne dans les régions AWS suivantes : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon).

Pour en savoir plus sur les instances Inf2, consultez la page Web Amazon EC2 Inf2 Instances et la documentation AWS Neuron.