问:什么是弹性 HPC 集群?

弹性集群让 HPC 环境除了具有与传统 HPC 集群相同的外观和使用体验之外,还具有可扩展性:作业提交到队列后节点根据需要启动、作业在空闲状态下自动启动以及节点在不需要时自动关闭。

问:将 Amazon Web Services 用于 HPC 有哪些好处?

AWS 具有弹性。您只需要按照使用量支付费用,无需在前期投入大量支出。如果 1000 个核心集群的使用时间只有一天,那么您只需要支付一天的费用。此外,借助基于云的集群,您可以持续使用最新硬件,并根据要在硬件上运行的应用程序自定义每个集群。许多 AWS HPC 客户每天都会启动和关闭很多集群。AWS 可以在大量地理区域运行,每个区域都可以包含多个大型可用区,而每个可用区都可以由一个或多个数据中心组成。这让 AWS 客户能够在他们选择的位置轻松高效地使用无限多的计算容量。

问:可以通过哪些方式在 AWS 上运行 HPC 应用程序?

支持 AWS 的开源商业 HPC 解决方案有很多。许多 HPC 用户选择使用 AWS ParallelCluster 来自定义软件以便满足自己的独特需求。还有一些 HPC 用户倾向于手动部署计算实例,或者使用能够通过 AWS CLI 调用 EC2 API 的脚本来部署计算实例。而对于某些用户来说,完全托管的 SaaS 可能是首选的方式。所有这些方案都是 AWS 客户在使用的可行方案。 

问:什么是 AWS ParallelCluster?

AWS ParallelCluster 是一种用于创建和启动 AWS CloudFormation 模板的工具。它是一种可以调用 Amazon EC2、Amazon EBS 和 Amazon S3 这几项 AWS 服务的 Python 应用程序。AWS ParallelCluster 还可以使用 Amazon SQS、Amazon DynamoDB、Amazon CloudWatch 和 AWS CloudFormation 来监控和维护集群。有关更多信息,请参阅 AWS ParallelCluster 文档。 

问:使用 AWS ParallelCluster 运行 HPC 应用程序有哪些好处?

借助 AWS ParallelCluster,您可以快速访问集群环境并在其中使用多种软件开发工具、共享磁盘、选择的计划软件、实例并运行监控功能。AWS ParallelCluster 可以对多个用户启动的软件进行排队。此外,由 AWS ParallelCluster 启动的环境经过充分的配置,您可以在其中使用 AWS 增强联网功能来运行 MPI 应用程序。

问:AWS ParallelCluster 软件的费用是多少?

AWS ParallelCluster 是 AWS 开发的一种免费的开源工具。

问:我的 HPC 集群中的 AWS 资源的费用是多少?

部署 HPC 集群后,产生的 AWS 基础设施费用一般包括您使用的主实例、计算节点、EBS 卷和所有 Amazon S3 存储的费用。有关更多信息,请参阅使用的服务与费用

问:如果应用程序需要不同的基础设施配置怎么办? 能否方便地使用 AWS ParallelCluster 进行试验?

可以。AWS ParallelCluster 特别适合试验,因为您可以根据自己的需求及其变化来轻松重新配置集群。此外,您可以对 pcluster 配置文件进行版本控制,以便记录在各项试验中使用的设置。当您需要实现最佳性能或最低成本时,AWS ParallelCluster 让您可以轻松地测试不同的集群配置项目,例如实例类型、操作系统和存储配置。