亚马逊AWS官方博客
Category: Expert (400)
使用 AWS 原生解决方案替换自我管理的数据库调度程序批处理作业
数据库管理员和开发人员通常使用运行数据库的主机上的系统 cron 或使用数据库调度程序来调度脚本,以针对数据库运行脚本,从而导致批处理脚本和数据库之间的紧密耦合。
在 Amazon EKS 上优化分布式深度学习性能的最佳实践
在本文中,我们将演示如何使用 Amazon Elastic Container Service for Kubernetes (Amazon EKS) 在 AWS 上创建完全托管的 Kubernetes 集群,以及如何使用 Kubeflow 和 AWS FSx CSI 驱动程序运行分布式深度学习训练作业。然后,我们将讨论在 Amazon EKS 上优化机器学习训练性能的最佳实践,以提高吞吐量并最大限度地缩短训练时间。