AWS 并行计算服务扩展了 Slurm 自定义功能
发布于:
2025年10月2日
AWS 并行计算服务 (AWS PCS) 现已扩展 Slurm 配置功能,支持设置另外 60 多个参数,实现对高性能计算 (HPC) 集群操作的精细化控制。此增强功能可为作业调度、资源分配、访问控制及作业生命周期管理提供更高的灵活性。
新的 Slurm 自定义设置可精细化管理各类资源管理场景,包括公平共享调度与服务质量级别。例如,您现在可实施队列特定的优先级策略、配置抢占设置,并设定自定义时间和资源限制。此外,您还可以在账户级别控制访问权限,并配置单个作业的执行行为。这些功能及其他特性可助您构建高效服务多个团队、项目及工作负载类型的生产级 HPC 环境。
AWS PCS 是一项托管服务,可让您更轻松地运行和扩展 HPC 工作负载,并使用 Slurm 在 AWS 上构建科学和工程模型。您可以使用 AWS PCS 构建集成计算、存储、网络和可视化工具的完整弹性环境。AWS PCS 可通过托管更新和内置可观测性功能简化集群操作,帮助减轻维护负担。您可以在熟悉的环境中工作,从而专注于研究和创新,而不必担心基础设施问题。
扩展的 Slurm 自定义设置现已在所有提供 AWS PCS 的 AWS 区域推出。要了解更多信息,请参阅 AWS PCS 用户指南。