Publié le: Aug 24, 2023

Les instances Amazon Elastic Compute Cloud (Amazon EC2) Trn1 sont désormais disponibles de manière générale dans la région USA Est (Ohio). Les instances Trn1 fournissent une formation haute performance sur les modèles d'IA générative les plus courants sur AWS, tout en offrant un coût de formation jusqu'à 50 % inférieur à celui des instances Amazon EC2 comparables. 

Vous pouvez utiliser les instances EC2 Trn1 pour former des grands modèles de langage populaires tels que GPT et LLaMA, des modèles de vision tels que Stable Diffusion et divers autres modèles deep learning à des fins de recommandation, de détection des fraudes, de prévision, etc. Les instances Trn1 sont activées par le SDK AWS Neuron, qui est intégré aux principaux frameworks ML tels que PyTorch et TensorFlow, et à des bibliothèques telles que Megatron-LM, NeMo, Neuron Distributed et Hugging Face. Ainsi, vous pouvez continuer à utiliser vos frameworks existants et exécuter votre application en modifiant le moins de code possible. Les développeurs peuvent exécuter des charges de travail d'entraînement Deep Learning sur des instances Trn1 à l'aide des AMI AWS Deep Learning, des conteneurs AWS Deep Learning ou de services gérés comme AWS ParallelCluster, Amazon Elastic Kubernetes Service (Amazon EKS), Amazon SageMaker, AWS Batch etc.

Les instances Amazon EC2 Trn1 sont disponibles en deux formats : trn1.2xlarge, pour expérimenter avec un seul accélérateur et effectuer un apprentissage efficace de petits modèles, et trn1.32xlarge pour entraîner des modèles à grande échelle. Elles sont proposées sous la forme d'instances à la demande, d'instances réservées et d'instances Spot ou dans le cadre d'un Savings Plan dans les régions AWS suivantes : USA Est (Virginie du Nord), USA Ouest (Oregon) et USA Est (Ohio).  

Pour en savoir plus sur les instances Trn1, consultez la page Web Instances Amazon EC2 Trn1 et la documentation AWS Neuron