Publié le: Sep 20, 2019
Aujourd’hui, nous annonçons la disponibilité générale des instances GPU G4 Amazon EC2, la famille d’instances optimisées GPU de nouvelle génération.
Les instances G4 Amazon EC2 fournissent la plateforme GPU la plus avantageuse en termes de coûts dédiée au déploiement de modèles de machine learining en production et d’applications à haute intensité de graphisme. Les instances G4 offrent les GPU NVIDIA T4 Tensor Core de nouvelle génération, des processeurs Intel® Xeon® Scalable (Cascade Lake) AWS personnalisés de deuxième génération, jusqu’à 50 Gbit/s de débit réseau et jusqu’à 900 Go de stockage NVMe local. Les instances bare-metal, à venir, offriront jusqu’à 100 Gbit/s de débit réseau et 1,8 To de stockage NVMe local.
Les instances G4 EC2 sont optimisées pour le déploiement d’applications de machine learning, à l’instar de la classification d’images, de la détection d’objets, des moteurs de recommandations, de la reconnaissance vocale automatique et de la traduction linguistique, qui nécessitent des bibliothèques logicielles à faible niveau de GPU. Ces instances offrent également des solutions à des coûts avantageux pour les applications gourmandes en ressources graphiques, par exemple les stations de travail graphiques, le transcodage vidéo et le streaming de jeux vidéo à distance dans le cloud. Les instances G4 EC2 sont disponibles en différentes tailles et sont associées à un accès à un ou plusieurs GPU avec des quantités variables de vCPU et de mémoire pour vous permettre de choisir la taille d’instance appropriée pour vos applications.
Les instances G4 sont disponibles sous forme d’instances à la demande, réservées et Spot dans les régions AWS USA Est (Virginie du Nord et Ohio), USA Ouest (Californie du Nord et Oregon), Europe (Francfort, Irlande et Londres) et Asie-Pacifique (Séoul et Tokyo). Les instances G4 sont également accessibles dans Amazon SageMaker. Pour en savoir plus sur les instances G4, consultez la page réservée aux instances G4.