Les instances Amazon EC2 P5 à GPU unique sont désormais disponibles pour tous
AWS annonce aujourd'hui une nouvelle taille d'instance Amazon Elastic Compute Cloud (Amazon EC2) P5 dotée d'un GPU NVIDIA H100 qui permet aux entreprises de dimensionner correctement leurs ressources de machine learning (ML) et de calcul haute performance (HPC) de manière rentable.
La nouvelle taille d'instance permet aux clients de commencer à petite échelle et de réduire horizontalement par incréments granulaires, offrant ainsi un contrôle plus flexible des coûts d'infrastructure. Les clients qui développent des grands modèles de langage (LLM) de petite à moyenne taille tels que des chatbots ou des outils de traduction linguistique spécialisés peuvent désormais exécuter des tâches d'inférence de manière plus économique. Les clients peuvent également utiliser ces instances pour déployer des applications HPC destinées à la découverte de produits pharmaceutiques, à l'analyse des flux de fluides et à la modélisation financière sans s'engager dans des déploiements de GPU coûteux et à grande échelle.
Les instances P5.4xlarge sont désormais disponibles via les blocs de capacité Amazon EC2 pour ML dans les régions AWS suivantes : USA Est (Virginie du Nord, Ohio), USA Ouest (Oregon), Europe (Londres), Asie-Pacifique (Mumbai, Sydney, Tokyo) et Amérique du Sud (São Paulo). Ces instances peuvent être achetées à la demande, selon la tarification Spot ou par le biais de Savings Plans en Europe (Londres), en Asie-Pacifique (Mumbai, Jakarta, Tokyo) et en Amérique du Sud (São Paulo).
Pour en savoir plus sur les instances P5.4xlarge, consultez la page Instances Amazon EC2 P5.