跳至主要内容

AWS Deep Learning AMI

在预配置的环境中快速构建可扩展、安全的深度学习应用程序

扩展

将分布式机器学习(ML)训练扩展到数千个加速实例,并在生产环境中无缝部署模型以进行推理。

开发

利用最新的驱动程序、框架、库和工具开发加速器,包括 AWS Trainium、AWS Inferentia 和 NVIDIA GPU。

降低风险

通过定期修补的自定义的稳定系统映像解决安全漏洞,从而降低风险。

在 Gartner 魔力象限中,AWS 被评为领导者

Gartner 将 AWS 评为云 AI 开发人员服务魔力象限的领导者。
       

阅读报告 

应用场景

无人驾驶汽车开发

大规模开发高级 ML 模型,通过使用数百万受支持的虚拟测试验证模型,安全地开发无人驾驶汽车(AV)技术。

自然语言处理

使用最新的框架和库(包括 Hugging Face Transformers)加快 AWS 实例的安装与配置,同时加快实验和评估流程。

医疗保健数据分析

使用高级分析、ML 和深度学习功能识别趋势,并且根据不同的原始运行状况数据进行预测。

加速模型训练

DLAMI 通过预配置的驱动程序、Intel Math Kernel Library(MKL)、Python 程序包和 Anaconda Platform 纳入最新的 NVIDIA GPU 加速。

客户成功案例

Toyota Research Institute

“在 Toyota Research Institute(TRI),我们致力于通过自动驾驶、能源与材料、以人为本的人工智能、人机交互驾驶、大行为模型以及机器人技术等方面的进步,来探寻提升人类生活质量的方法。机器学习在我们的工作中占据着核心地位。AWS Deep Learning AMI 极大地促进了我们的研究进程。它们使我们的团队能够利用预先配置好的无需任何设置即可直接使用的 NVIDIA 和 CUDA 驱动程序,迅速在 EC2 上启动并扩展高性能的机器学习环境。这种稳定性和易用性显著降低了我们的运营成本,使我们的研究人员和数据科学家能够将精力集中在工作中的实际难题上,而无需再去管理基础设施。通过优化我们的机器学习工具,AWS DLAMI 使我们能够将精力集中在真正重要的事情上,即实现技术突破,并为新产品和服务创造机会,从而实现“人人幸福”的理念。AWS Deep Learning AMI 的效率和可靠性使其成为 TRI 工具包中不可或缺的一部分。” 


Satya Kotari,TRI 技术主管。

Missing alt text value

Cimpress

Cimpress 长期投资和建立以客户为中心的创业型印刷大规模定制业务。Cimpress 让客户能以轻松且经济实惠的方式给客户、组织或亲人留下深刻的印象。无论是扩大企业品牌的宣传材料还是庆祝出生的公告,Cimpress 都能将客户想要的个性化需求与实物产品的切实影响完美融合。

“Cimpress 使用 AWS Deep Learning AMI 来快速设置和部署我们的机器学习环境。DLAMI 减少了我们的运营开销,通过专注于训练和部署用于计算机视觉和生成式人工智能的深度学习模型的核心工作,我们能够更快地将产品推向市场。”

Ajay Joshi,Cimpress 首席软件工程师

Missing alt text value

Flip AI

Flip AI 是第一个不受数据和平台限制的 GenAI 原生可观测性平台,了解所有可观察性模式(包括指标、事件、日志和跟踪),并可在几秒钟内生成预测和事件根本原因分析。

“在 Flip AI,我们训练了自己的 DevOps LLM 来调试生产事件,以帮助企业达到最高水平的客户体验。此训练需要易于定制的高性能设置。有了 DLAMI,我们不需要与 CUDA 驱动程序或 Pytorch 相关优化进行斗争。它的确很棒!提高 GPU 利用率意味着我们能够更有效地训练模型,并将推理时间缩短 10 毫秒。”

Sunil Mallya,Flip AI 首席技术官

Missing alt text value

Torc Robotics

Torc Robotics 是 Daimler Truck AG 的独立子公司,后者是全球卡车行业的领军者和先驱企业,致力于通过 L4 级自动驾驶 8 类卡车来革新长途货运模式

“AWS Deep Learning AMI 在推动 Torc 开发行业领先的高级驾驶辅助系统方面发挥了重要作用。DLAMI 使我们能够迅速在 AWS EC2 实例上设置并部署机器学习环境,这对于我们的研究和开发工作至关重要。预装的 NVIDIA 和 CUDA 驱动程序无需任何设置即可直接使用,它们提供了稳定且可靠的平台,大大降低了我们的运营成本。通过简化我们的机器学习基础设施管理,AWS DLAMI 使我们能够将资源投入到加快产品推向市场的过程中。AWS Deep Learning AMI 的高效性和可靠性使其成为推动 Torc 实现自动驾驶汽车领域的核心使命不可或缺的工具。”

Jason Fox,Torc 开发人员平台高级工程经理

Missing alt text value

工作原理

AWS Deep Learning AMI(DLAMI)为机器学习从业者和研究人员提供一组精心策划的安全框架、依赖项和工具,以加速 Amazon EC2 中的深度学习。亚马逊机器映像(AMI)专为 Amazon Linux 和 Ubuntu 构建,预配置了 TensorFlow、PyTorch、NVIDIA CUDA 驱动程序和库、Intel MKL、Elastic Fabric Adapter(EFA)和 AWS OFI NCCL 插件,让您可以快速地大规模部署和运行这些框架和工具。

re:Invent 研讨会

AWS re:Invent 2023 — 在 AWS 深度学习 AMI 和 PyTorch 上进行大型模型训练,嘉宾为Pinterest — AIM326