亚马逊AWS官方博客
Tag: EFA
地震波3D建模开源实现的云上HPC构架和落地仿真
通过对地震波建模SPECFEM3D和EFISPEC3D的两种开源实现在亚马逊云科技HPC架构上的落地介绍,展示了Amazon ParallelCluster的集群管理能力,使用置放群组、Elastic Fabric Adapter(EFA)和Amazon FSx for Lustre服务优化,满足了高性能计算的要求。
使用 Ubuntu18 DLAMI,P3dn 实例与 EFA,和 Amazon FSx for Lustre 实现大规模多 GPU 分布式深度学习训练
为深度学习训练设置机器学习基础设施往往是一项艰巨的任务,您通常需要依赖基础设施团队构建起相应环境,这将极大浪费宝贵的生产时间。此外,深度学习技术库与软件包也一直在快速变化,您需要测试各软件包之间的互操作性。使用Ubuntu 18 DLAMI,您将无需担心于基础设施设置与软件安装工作。AWS DLAMI已经为所有主流机器学习框架预先构建了必要的深度学习库与软件包,让您能够专注于模型的训练、调优与推理。