发布于: May 1, 2019

Amazon EKS Deep Learning Benchmark Utility 是一种新的自动化工具,用于在 Kubernetes 集群上对机器学习进行基准测试。该工具由 Amazon Elastic Container Service for Kubernetes (EKS) 团队构建和开源。

Kubernetes 是一款开源软件,借助它您可以轻松快速扩展机器学习模型以进行训练和推理,并在 AWS 上靠近您的数据源运行它们。由于在 Kubernetes 上运行机器学习作业存在多种变量和基础设施选择,所以为您的工作负载找到正确的配置需要持续的基准测试。以前,对 Kubernetes 上的机器学习性能进行基准测试需要您为每个性能优化执行多个手动步骤,从而增加了大量时间和精力来设置经济高效的机器学习作业。

Amazon EKS Deep Learning Benchmark Utility 简化了在 AWS 上运行的 Kubernetes 集群的性能基准测试,以进行深度学习训练和其他机器学习工作负载。该实用程序提供从集群创建到集群拆除的自动化端到端基准测试工作流程,支持高度可配置的集群配置、不同的后端存储系统以及包括 Tensorflow、Horovod、OpenMPI、PyTorch 和MxNet 在内的多个框架。

要了解更多信息,请访问 GitHub 上的项目。

阅读我们的博客,了解有关使用 Amazon EKS 优化分布式深度学习性能的更多信息。