Publié le: Sep 24, 2020
AWS a étendu la disponibilité des instances Inf1 d'Amazon EC2 à l'Europe (Paris), l'Asie-Pacifique (Mumbai, Singapour) et l'Amérique du Sud (São Paulo). Les instances Inf1 sont alimentées par des puces AWS Inferentia, conçues spécifiquement par AWS pour offrir des performances élevées et l'inférence de machine learning la plus économique dans le cloud.
Ces instances affichent des performances jusqu'à 30 % plus élevées pour un coût jusqu'à 45 % inférieur par inférence par rapport aux instances GPU premier prix. Elles sont idéales pour, par exemple, la reconnaissance d'images, le traitement automatique du langage naturel, la personnalisation et la détection des anomalies.
Pour démarrer rapidement avec les instances Inf1, le plus simple est de commencer en utilisant Amazon SageMaker, un service entièrement géré de création, d'entraînement et de déploiement des modèles de machine learning. Quant aux développeurs qui préfèrent gérer leur propre plateforme de développement d'applications de machine learning, ils peuvent faire leurs premiers pas soit en lançant les instances Inf1 avec des AMI AWS Deep Learning, dont le kit SDK Neuron, soit utiliser les instances Inf1 avec Amazon Elastic Kubernetes Service (EKS) ou Amazon Elastic Container Service (ECS) pour les applications ML conteneurisées.
Les instances Inf1 d'Amazon EC2 sont disponibles dans quatre tailles, offrant jusqu'à 16 puces Inferentia, 96 vCPU, 192 Go de mémoire, 100 Gbit/s de bande passante de réseau et 19 Gbit/s de bande passante Elastic Block Store (EBS). Ces instances sont accessibles à la demande, sous la forme d'instances réservées, d'instances Spot ou via les Savings Plans. Elles sont disponibles dans 11 régions autour du monde, y compris les régions USA Est (Virginie du Nord, Ohio), USA Ouest (Oregon), Europe (Francfort, Irlande, Paris), Asie-Pacifique (Mumbai, Singapour, Sydney, Tokyo) et Amérique du Sud (São Paulo).
Pour commencer, consultez le Guide de démarrage. Pour en savoir plus, consultez la page de présentation des instances Inf1 d'Amazon EC2.