Publié le: Nov 11, 2022

Les tâches d'entraînement Amazon SageMaker prennent désormais en charge les instances ml.trn1, alimentées par les puces AWS Trainium, spécialement conçues pour les applications d'apprentissage machine learning haute performance dans le cloud. Vous pouvez utiliser les instances ml.trn1 sur SageMaker pour d'effectuer l'apprentissage de modèles de traitement du langage naturel (NLP), de vision par ordinateur et de recommandation pour un large éventail d'applications : reconnaissance vocale, recommandation, détection de la fraude, classification d'images et de vidéos, prévision, etc.

Les instances ml.trn1 peuvent comporter jusqu'à 16 puces AWS Trainium, une puce de machine learning de deuxième génération conçue par AWS après AWS Inferentia. Les instances ml.trn1 sont les premières instances EC2 offrant jusqu'à 800 Gbit/s de bande passante réseau Elastic Fabric Adapter (EFA). Pour un parallélisme efficace des données et des modèles, chaque instance ml.trn1.32xl possède 512 Go de mémoire à large bande passante, fournit jusqu'à 3,4 pétaflops de puissance de calcul FP16/BF16 et dispose de NeuronLink, une interconnexion non bloquante à large bande passante intra-instance.

Les instances ml.trn1 sont disponibles en deux formats : ml.trn1.2xlarge, pour expérimenter avec un seul accélérateur et effectuer un apprentissage efficace de petits modèles, et ml.trn1.32xlarge pour entraîner des modèles à grande échelle. L'entraînement de modèle SageMaker prend en charge les instances ml.trn1 actuellement dans les régions AWS USA Est (Virginie du Nord) et USA Ouest (Oregon).

Pour en savoir plus sur les instances ml.trn1, consultez le blog des actualités AWS ou la page dédiée à l'instance Trn1. Pour commencer à utiliser les instances ml.trn1, connectez-vous à la console Amazon SageMaker. Pour en savoir plus sur l'entraînement de modèle Amazon SageMaker, visitez notre page web.