Publié le: Dec 3, 2019

Aujourd’hui, nous annonçons la disponibilité générale des instances Inf1 d'Amazon EC2, créées de A à Z pour prendre en charge les applications d'inférence de machine learning. Les instances Inf1 comportent jusqu'à 16 puces AWS Inferentia. Il s'agit de puces d'inférence de machine learning spécialement conçues et fabriquées par AWS pour offrir des performances élevées. Nous avons en outre combiné les puces Inferentia aux derniers processeurs évolutifs Intel® Xeon® de 2e génération, ainsi qu'à une mise en réseau à un débit atteignant 100 Gbit/s, afin d’assurer une inférence à haut débit. Grâce à cette puissante configuration, les instances Inf1 offrent un débit jusqu'à trois fois plus élevé et un coût par inférence jusqu'à 40 % inférieur à celui des instances Amazon EC2 G4; alors même que ces dernières étaient déjà les instances les plus moins chères pour l'inférence de machine learning disponible dans le cloud.

Les instances Inf1 d'Amazon EC2 offrent des performances élevées et l'inférence de machine learning la plus économique du cloud. Les clients qui utilisent les instances Inf1 peuvent exécuter des applications d'inférence de machine learning à grande échelle, comme la reconnaissance d'images, la reconnaissance vocale, le traitement du langage naturel, la personnalisation et la détection des fraudes, tout cela aux coûts les plus réduits du cloud.  

AWS facilite le déploiement de votre application de machine learning sur les instances Inf1 d'Amazon EC2. Une fois votre modèle formé, vous pouvez utiliser AWS Neuron, un SDK permettant l’exécution d’inférence grâce à des puces AWS Inferentia, qui est constitué d’un compilateur, d'un environnement d'exécution et d'outils de profilage. Neuron est pré-intégré dans les cadres de machine learning les plus courants, comme TensorFlow, Pytorch, et MXNet, afin d’optimiser les performances des instances Inf1 d'EC2. Les instances Inf1 peuvent être déployées avec les AMI AWS Deep Learning et seront disponibles via des services gérés comme Amazon SageMaker, EKS et ECS.

Les instances Inf1 d'Amazon EC2 sont disponibles en quatre tailles dans les régions AWS USA Est (Virginie du Nord) et USA Ouest (Oregon) en tant qu’instances à la demande, instances réservées et instances Spot, ou dans le contexte d’un Savings Plan. Pour en savoir plus sur les instances Inf1, consultez la page Inf1.