发布于: Feb 4, 2019
现在,Amazon Elastic Container Service (ECS) 宣布对 EC2 GPU 实例上运行的机器学习和高性能计算应用提供增强的支持。ECS 任务定义现可允许您指定多个 GPU 分配至具体的容器,ECS 将相应地标定实现工作量隔离和最优性能。
在 ECS 上运用 GPU 之前,您必须先自定义配置 AMI,使用自定义 vCPU 布局逻辑作为代理,以尝试将物理 GPU 分配至特定容器。此外,您不能执行任何标定或隔离。现在,您可以使用具有 p2 和 p3 实例的经 ECS GPU 优化的 AMI,通过预先配置的 Nvidia 内核驱动程序、适当的 Docker GPU 运行时间以及 CUDA 默认版本而准备就绪。任务定义现允许您指定多个 GPU 分配至特定容器,ECS 将其用作调度机制。由于您的容器位于这些实例上,因此 ECS 将物理 GPU 标定至所需容器,以实现工作负载隔离和最佳性能。