投稿日: Aug 24, 2023

Amazon Elastic Compute Cloud (Amazon EC2) Trn1 インスタンスの一般提供が、米国東部 (オハイオ) リージョンで開始されました。Trn1 インスタンスは、人気のある生成系 AI モデルの高性能トレーニングを AWS で提供するとともに、同等の Amazon EC2 インスタンスよりもトレーニングコストを最大 50% 削減します。 

EC2 Trn1 インスタンスを使用して、GPT や LLaMA などの一般的な大規模言語モデル、Stable Diffusion などのビジョンモデルのほか、レコメンデーション、不正検出、予測などのさまざまな深層学習モデルをトレーニングできます。Trn1 インスタンスは、PyTorch や TensorFlow などの主要な ML フレームワークや Megatron-LM、NeMo、Neuron Distributed、Hugging Face などのライブラリと統合されている AWS Neuron SDK によって有効化されているため、既存のフレームワークを引き続き使用し、最小限のコード変更でアプリケーションを実行できます。開発者は、深層学習トレーニングのワークロードを、AWS Deep Learning AMI や AWS Deep Learning Containers を使用して、あるいは、AWS ParallelCluster、Amazon Elastic Kubernetes Service (Amazon EKS)、Amazon SageMaker、AWS Batch などのマネージドサービスを使用して、Trn1n インスタンス上で実行できます。

Amazon EC2 Trn1 インスタンスには 2 つのサイズが用意されています。trn1.2xlarge は 1 つのアクセラレータを使用して実験し、費用対効果の高い小さなモデルをトレーニングするためのもので、trn1.32xlarge は大規模なモデルをトレーニングするためのものです。これらは、オンデマンドインスタンス、リザーブドインスタンス、スポットインスタンスとして、または Savings Plan の一部として、米国東部 (バージニア北部)、米国西部 (オレゴン)、および米国東部 (オハイオ) の AWS リージョンで利用できます。  

Trn1 インスタンスの詳細については、Amazon EC2 Trn1 インスタンスのウェブページAWS Neuron のドキュメントを参照してください。