Publicado en: Aug 24, 2023

Las instancias Trn1 de Amazon Elastic Compute Cloud (Amazon EC2) ya están disponibles de forma general en la región Este de EE. UU. (Ohio). Las instancias Trn1 ofrecen un entrenamiento de alto rendimiento de los modelos más conocidos de IA generativa en AWS y, al mismo tiempo, tienen un costo de entrenamiento hasta un 50 % inferior al de las instancias de Amazon EC2 comparables. 

Puede utilizar las instancias Trn1 de EC2 para entrenar modelos de lenguaje de gran tamaño conocidos, como GPT y LlAMA, modelos de visión, como Stable Diffusion, y una variedad de otros modelos de deep learning para recomendaciones, detección de fraudes, pronósticos y más. Las instancias Trn1 están habilitadas por el SDK de AWS Neuron, el cual está integrado con los principales marcos de machine learning, como PyTorch y TensorFlow, y bibliotecas como Megatron-LM, NeMo, Neuron Distributed y Hugging Face, para que pueda seguir utilizando sus marcos existentes y ejecutar su aplicación con cambios de código mínimos. Los desarrolladores pueden ejecutar cargas de trabajo de entrenamiento de deep learning en instancias Trn1 mediante las AMI de Deep Learning AWS, los contenedores de Deep Learning de AWS o servicios administrados como AWS ParallelCluster, Amazon Elastic Kubernetes Service (Amazon EKS), Amazon SageMaker, AWS Batch, etc.

Las instancias Trn1 de Amazon EC2 están disponibles en dos tamaños: trn1.2xlarge, para experimentar con un único acelerador y entrenar modelos pequeños de manera rentable; y trn1.32xlarge, para entrenar modelos de gran escala. Están disponibles en las siguientes regiones de AWS como instancias bajo demanda, instancias reservadas e instancias de spot, o como parte de Savings Plan: Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón) y Este de EE. UU. (Ohio).  

Para obtener más información sobre las instancias Trn1, consulte la página web de las instancias Trn1 de Amazon EC2 y la documentación de AWS Neuron