Amazon SageMaker HyperPod 现在支持 NVIDIA 多实例 GPU(MIG),以处理生成式人工智能任务
Amazon SageMaker HyperPod 现在支持 NVIDIA 多实例 GPU(MIG)技术,让管理员能够将单个 GPU 划分成多个独立的 GPU。这项功能让管理员能够在 GPU 分区上同时运行各种小型生成式人工智能(GenAI)任务,在保持性能和任务隔离的同时最大限度地提高资源利用率。
管理员可以选择在 SageMaker HyperPod 控制台上使用便捷的配置,也可以采用自定义设置方式,为不需要全部 GPU 计算资源的特定任务提供精细的、硬件隔离的资源。他们还可以分配计算配额,以便确保在不同团队之间公平高效地分配 GPU 分区。借助覆盖各个 GPU 分区的实时性能指标和资源利用率监控控制面板,管理员能够清晰地了解相关信息,从而优化资源分配。数据科学家现在可以通过在 GPU 分区上调度轻量级推理任务并且并行运行交互式 Notebook 来加速上市速度,从而无需再等待 GPU 资源空闲。
这项功能目前适用于使用 EKS 编排工具的 Amazon SageMaker HyperPod 集群,并且已在以下 AWS 区域推出:美国西部(俄勒冈州)、美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)、美国西部(北加利福尼亚)、加拿大(中部)、南美洲(圣保罗)、欧洲地区(斯德哥尔摩)、欧洲(西班牙)、欧洲地区(爱尔兰)、欧洲地区(法兰克福)、欧洲地区(伦敦)、亚太地区(孟买)、亚太地区(雅加达)、亚太地区(墨尔本)、亚太地区(东京)、亚太地区(悉尼)、亚太地区(首尔)、亚太地区(新加坡)。
要了解更多信息,请访问 SageMaker HyperPod 网页和 SageMaker HyperPod 文档。