发布于: Aug 24, 2023
Amazon Elastic Compute Cloud (Amazon EC2) Trn1 实例现已在美国东部(俄亥俄州)区域全面推出。Trn1 实例可在 AWS 上为常用生成式人工智能模型提供高性能训练,同时与同类的 Amazon EC2 实例相比,训练成本可降低多达 50%。
您可以使用 EC2 Trn1 实例来训练常用的 GPT 和 LLaMA 等大型语言模型、稳态扩散等视觉模型,以及用于推荐、欺诈检测和预测等的各种其他深度学习模型。Trn1 实例由 AWS Neuron SDK 提供支持,后者与 PyTorch 和 TensorFlow 等领先的机器学习框架以及 Megatron-LM、NeMo、Neuron Distributed 和 Hugging Face 等库集成,因此您可以继续使用现有框架,并以最少的代码更改运行应用程序。开发人员可以在 Trn1 实例上使用 AWS 深度学习 AMI、AWS 深度学习容器或 AWS ParallelCluster、Amazon Elastic Kubernetes Service (Amazon EKS)、Amazon SageMaker 和 AWS Batch 等托管服务运行深度学习训练工作负载。
Amazon EC2 Trn1 实例有两种大小:trn1.2xlarge(用于试验单个加速器并经济高效地训练小型模型),trn1.32xlarge(用于训练大型模型)。此类实例已在以下 AWS 区域作为按需型实例、预留实例和竞价型实例或作为 Savings Plan 的一部分推出:美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)和美国东部(俄亥俄州)。
要了解有关 Trn1 实例的更多信息,请参阅 Amazon EC2 Trn1 实例网页和 AWS Neuron 文档。