亚马逊AWS官方博客

在 Amazon EKS 上优化分布式深度学习性能的最佳实践

在本文中,我们将演示如何使用 Amazon Elastic Container Service for Kubernetes (Amazon EKS) 在 AWS 上创建完全托管的 Kubernetes 集群,以及如何使用 Kubeflow 和 AWS FSx CSI 驱动程序运行分布式深度学习训练作业。然后,我们将讨论在 Amazon EKS 上优化机器学习训练性能的最佳实践,以提高吞吐量并最大限度地缩短训练时间。

Read More

新增功能 – 使用 AWS Systems Manager Parameter Store 查询 AWS 区域、终端节点等

为响应 AWS 客户的请求,我一直要求我们的服务团队寻找方法,以编程方式提供关于我们的区域和服务的信息。今天,我很高兴地宣布这些信息已在 AWS Systems Manager Parameter Store 中提供,而且您可以通过自己的脚本和代码轻松访问这些信息。您可以获得活动区域的完整列表,了解这些区域提供哪些服务等。

Read More