发布于: Nov 30, 2021
今天,我们宣布推出基于 AWS Trainium 的 Amazon EC2 Trn1 实例的预览版。AWS Trainium 是由 AWS 构建的第二种机器学习芯片,并针对高性能深度学习训练对它进行过优化。
Trn1 实例将为云中的使用案例提供最佳性价比,以训练深度学习模型,如自然语言处理、物体检测、图像识别、推荐引擎和智能搜索,等等。它们支持多达 16 个 Trainium 加速器,最高 800 Gbps 的 EFA 网络吞吐量(其网络带宽是基于 GPU 的实例的两倍)和超高速实例内连接,以便在 Amazon EC2 中实现最快的 机器学习 (ML) 训练。
它们被部署到 EC2 UltraClusters 当中,后者可被扩展到数万个 Trainium 加速器,并支持 PB 级非阻塞联网。这些 Trn1 UltraClusters 比上一代 EC2 UltraClusters 大 2.5 倍,可作为功能强大的超级计算机来快速训练最复杂的深度学习模型。
如果对 Trn1 实例感兴趣,您可以通过访问我们的产品详细信息页面注册体验预览版。