Publicado: Aug 24, 2023

As instâncias Trn1 do Amazon Elastic Compute Cloud (Amazon EC2) agora estão disponíveis na região Leste dos EUA (Ohio). As instâncias Trn1 oferecem treinamento de alta performance de modelos populares de IA generativa na AWS, ao mesmo tempo em que oferecem um custo de treinamento até 50% menor do que instâncias comparáveis do Amazon EC2. 

Você pode usar as instâncias Trn1 do EC2 para treinar grandes modelos de linguagem populares, como GPT e LLama, modelos de visão, como Stable Diffusion, e uma variedade de outros modelos de aprendizado profundo para recomendação, detecção de fraudes, previsão e muito mais. As instâncias Trn1 são habilitadas pelo AWS Neuron SDK, que é integrado às principais estruturas de machine learning, como PyTorch e TensorFlow, e bibliotecas, como Megatron-LM, NeMo, Neuron Distributed e Hugging Face, para que você possa continuar usando suas estruturas existentes e executar sua aplicação com o mínimo de alterações de código. Os desenvolvedores podem executar workloads de aprendizado em instâncias Trn1 usando AMIs de deep learning da AWS, contêineres de deep learning da AWS ou serviços gerenciados, como AWS ParallelCluster, Amazon Elastic Kubernetes Service (Amazon EKS), Amazon SageMaker, AWS Batch etc.

As instâncias Trn1 do Amazon EC2 estão disponíveis em dois tamanhos: trn1.2xlarge, para experimentos com um único acelerador e treinamento de pequenos modelos com economia e trn1.32xlarge para treinamento de modelos em grande escala. Elas estão disponíveis como instâncias sob demanda, reservadas ou spot, ou como parte de um Savings Plan, nas seguintes regiões da AWS: Leste dos EUA (N. da Virgínia), Oeste dos EUA (Oregon) e Leste dos EUA (Ohio).  

Para saber mais sobre as instâncias Trn1, consulte a página de instâncias Trn1 do Amazon EC2 e a documentação do AWS Neuron