亚马逊AWS官方博客

新增功能 – Amazon EC2 Hpc6a 实例针对高性能计算进行了优化

高性能计算(HPC)使科学家和工程师能够解决复杂的计算密集型问题,例如计算流体动力学(CFD)、天气预报和基因组学。HPC 应用程序通常需要具有高内存带宽、低延迟、高带宽网络互连和访问快速并行文件系统的实例。

许多客户转而使用 AWS 来运行他们的 HPC 工作负载。例如,Descartes Labs 使用 AWS 为 TOP500 LINPACK 基准测试(最强大的商用计算机系统)比赛提供支持,交付了 1.93 PFLOPS,在 2019 年 6 月的 TOP500 榜单上排名第 136 位。这次比赛使用了 Amazon EC2 C5 实例集群上的 41,472 个核心。去年,Descartes Labs 再次参加了 LINPACK 基准测试,并凭借其在 EC2 实例集群上的 172,692 个内核,在 2021 年 6 月的 TOP500 榜单中名列前 40 名,这意味着在短短两年内性能增长了 417%。

借助 AWS,您可以在云中运行 HPC,并扩展到数以万计的并行任务(而这些任务在大多数本地环境中都不切实际),从而加快研究速度并缩短取得成果的时间。AWS 通过按需提供 CPUGPUFPGA 实例、Elastic Fabric Adapter(EFA,一种可提高吞吐量和扩展紧密耦合工作负载的 EC2 网络设备)和 AWS ParallelCluster(一款开源集群管理工具,可让您轻松地在 AWS 上部署和管理 HPC 集群),帮助您降低成本。

宣布推出面向 HPC 工作负载的 EC2 Hpc6a 实例
如今,各行各业的客户都在使用支持计算优化型 EFA 的 Amazon EC2 实例(例如 C5nR5n、M5nM5zn)来最大限度地提高各种 HPC 工作负载的性能,但随着这些工作负载扩展到数以万计的内核,成本效益变得越来越重要。我们发现,客户不仅希望优化其 HPC 工作负载的性能,而且还希望优化成本。

正如我们在 2021 年 11 月预告的那样,经过 HPC 优化的全新 EC2 实例 Hpc6a 从今天起正式上市。此实例通过 EFA 提供 100Gbps 的联网速度,搭载 96 个第三代 AMD EPYC™ 处理器(Milan)核心和 384GB RAM,与基于 x86 的同类计算优化型实例相比,性价比提高了 65%。

您现在可以在美国东部(俄亥俄)和 GovCloud(美国西部)区域以按需专属主机方式启动 Hpc6a 实例,也可以作为 Savings Plan 的一部分启动 Hpc6a 实例。以下是详细规格:

实例名称 CPU 数量 RAM EFA 网络带宽 附加存储
hpc6a.48xlarge 96 384GiB 最高 100Gbps 仅限 EBS

*Hpc6a 实例禁用了同步多线程功能,以便针对 HPC 代码进行优化。这意味着 Hpc6a vCPU 与其他 EC2 实例不同,它是物理核心,而不是线程。

为了实现 HPC 工作负载的可预测线程性能和高效调度,禁用了同步多线程。借助 AWS Nitro 系统,管理程序不会阻止任何核心,从而使所有核心都可用于您的代码。

Hpc6a 实例引入了许多有针对性的功能,可为运行紧密耦合 HPC 工作负载(这些负载依赖高水平实例间通信)的客户提供成本和性能优化。这些实例可实现 100Gbps 的 EFA 联网带宽,旨在在单个可用区内高效扩展大型紧密耦合集群。

我们从许多工程客户(例如汽车行业的客户)那里听说,他们希望减少对物理测试的需求,并以更低的成本更快地转向基于虚拟模拟的产品设计流程。

根据 Siemens Simcenter STAR-CCM+ 汽车 CFD 模拟的基准测试结果,当 Hpc6a 在 EFA 联网的帮助下扩展到 400 个节点(约 40,000 个内核)时,它能保持大约 100% 的扩展效率。与 c5n 相比,Hpc6a 实例的成本降低了 70%,这意味着公司在使用 Hpc6a 实例时可以以更低的成本更快地交付新设计。这意味着在使用 Hpc6a 实例时,公司可以以更低的成本更快地交付新设计。

您可以将 Hpc6a 实例与 AMD EPYC 第三代(Milan)处理器配合使用,在 EC2 上运行规模最大、最复杂的 HPC 模拟,并针对成本和性能进行优化。客户还可以将新的 Hpc6a 实例与 AWS BatchAWS ParallelCluster 结合使用,以简化工作负载提交和集群创建工作。

要了解更多信息,请访问我们的 Hpc6a 实例页面,并联系我们的 HPC 团队适用于 EC2 的 AWS re: Post,或联系您平时的 AWS Support 联系人来了解相关信息。

Channy