发布于: May 17, 2024

今天,AWS 宣布,专为容器构建的基于 Linux 的操作系统 Bottlerocket 现在支持 NVIDIA 编织架构管理器,从而使用户能够利用多 GPU 配置的强大功能来处理其人工智能和机器学习工作负载。通过这种集成,Bottlerocket 用户现在可以无缝地利用其连接的 GPU 作为高性能计算编织架构,从而在每个 P4/P5 实例中的所有 GPU 之间实现高效、低延迟的通信。

深度学习模型日益复杂,导致在合理的时间范围内训练这些模型所需的计算资源呈指数级增长。为了应对这种不断增长的计算需求,运行人工智能和机器学习工作负载的客户已转向多 GPU 实施,利用 NVIDIA 的 NVSwitch 和 NVLink 技术在连接的 GPU 上创建统一的内存编织架构。Bottlerocket NVIDIA 变体中对编织架构管理器的支持允许用户配置此编织架构,从而使所有 GPU 都能用作单个高性能池,而不是单个单元。这使 Bottlerocket 用户能够在 P4/P5 实例上运行多 GPU 设置,从而显著加快了复杂神经网络的训练速度。

要了解有关 Bottlerocket NVIDIA 变体中编织架构管理器支持的更多信息,请访问官方 Bottlerocket GitHub 存储库