AWS Deep Learning Containers
优势
使用预打包且经过完整测试的 Docker 镜像,在几分钟内部署深度学习环境。
通过适用于常见框架(如 TensorFlow、PyTorch 和 Apache MXNet)的优化模型训练,自动提升性能。
以微服务的方式将机器学习(ML)快速添加到在 Amazon EKS 和 Amazon EC2 上运行的应用程序中。
通过与 Amazon SageMaker、Amazon EKS 和 Amazon ECS 集成构建自定义机器学习工作流,用于训练、验证和部署。
使用案例
无人驾驶汽车 (AV) 部署
大规模开发高级 ML 模型,在您的环境中安全、快速地部署 AV 技术。
自然语言处理 (NLP)
使用最新的框架和库(包括 Hugging Face Transformers)减少部署 ML 模型所需的时间,同时加快投入生产的时间。
医疗保健数据分析
使用高级分析、ML 和深度学习功能分析不同的原始运行状况数据,以此识别趋势并进行预测。
支持的深度学习容器
|
Operating systems
|
Frameworks
|
Instances
|
Platforms
|
|---|---|---|---|
|
Ubuntu Linux
|
PyTorch |
AWS Trainium |
Amazon EC2 |
|
|
TensorFlow |
NVIDIA GPU |
Amazon ECS |
|
|
|
AWS Inferentia |
Amazon EKS |
|
|
|
|
AWS Graviton |
有关深度学习容器支持的详细信息,请参阅发行说明。
客户成功案例
Roblox
Roblox 是一个沉浸式的游戏和创作平台,为人们提供了数百万种聚会方式,邀请其社区成员探索、创造和分享无尽的独特体验。Roblox 全球社区由数百万名开发人员组成,他们通过 Roblox Studio 创建和发布自己的沉浸式多人游戏体验。Roblox Studio 是该平台的多合一创作引擎,任何人都可以利用它构建自己想象中的一切。
作为 Roblox 人工智能平台的一部分,我们在整个业务中训练并部署 250 多个模型。实际上,Roblox 上的每一次互动都有某种形式的人工智能驱动,包括安全性、生成式人工智能 3D 内容创作、体验推荐、实时翻译和其他用例。我们正在将 AWS 深度学习容器用于我们的 EKS GPU 节点组,因此我们不必担心基础设施、Nvidia 驱动程序和 CUDA 安装——这是可直接使用的。我们可以专注于对我们真正重要的事情,改进 GPU 调度和 GPU 利用率,以使我们的用户受益,降低我们为这些人工智能工作负载提供服务的成本。
Denis Goupil,Roblox 首席机器学习工程师