发布于: Dec 19, 2023

AWS ParallelCluster 3.8 现已正式推出。此版本中的主要功能支持 Rocky Linux 8 和适用于机器学习的 Amazon EC2 容量块,允许您在将来预留备受欢迎的 GPU 实例,以支持您的短期机器学习 (ML) 工作负载。此版本中的其他重要功能包括:

  • 扩展策略可帮助您满足扩展和成本要求,从严格的“全有或全无”(避免启动空闲实例)到尽力而为(优先考虑吞吐量扩展,而不是避免使用空闲实例)不等。
  • 支持将 AWS 中用户定义的文件系统安装到首节点的 /home 目录,从而帮助您简化集群存储管理。 
  • 自定义 Munge 密钥可帮助您简化需要调度器 Munge 密钥的其他集群资源的集成。

有关此版本的更多详细信息,请查看 AWS ParallelCluster 3.8 发行说明

AWS ParallelCluster 是一种受到全面支持和维护的开源集群管理工具,利用此工具,研发客户及其 IT 管理员可以在 AWS 上运行高性能计算 (HPC) 集群。AWS ParallelCluster 旨在以安全方式自动将云资源预置为可弹性扩展的 HPC 集群,以便在 AWS 上大规模运行科学、工程和机器学习 (ML/AI) 工作负载。 

AWS ParallelCluster 在此处列出的 AWS 区域免费提供,您只需为运行应用程序所需的 AWS 资源付费。要了解有关在 AWS 上启动 HPC 集群的更多信息,请访问 AWS ParallelCluster 用户指南。要开始使用 ParallelCluster,请参阅 ParallelCluster UICLI 的安装说明。