Amazon SageMaker HyperPod 现在支持用于持久性存储的 Amazon EBS CSI 驱动程序

发布于: 2025年8月27日

Amazon SageMaker HyperPod 现在支持 Amazon Elastic Block Store (EBS) Container Storage Interface (CSI) 驱动程序,使客户能够在 SageMaker HyperPod EKS 集群上为机器学习工作负载动态预置和管理持久性存储。此功能允许客户通过 Kubernetes 持久性卷声明创建、附加和管理 EBS 卷,从而提供在容器组重启和节点更换期间持久存在的存储。部署训练和推理工作负载的客户需要灵活的存储分配,同时保持高性能,而之前需要在 Kubernetes 工作流程之外手动管理 EBS 卷。

EBS CSI 驱动程序支持使客户能够根据模型要求动态预置卷,在不中断服务的情况下调整卷大小,并创建快照以用于备份和恢复。对于训练工作负载,这为数据集、模型检查点和共享构件提供了持久性存储。对于推理工作负载,客户可以预置模型存储、创建缓存卷并维护事件日志记录。该集成支持通过 Kubernetes 存储类别进行静态和动态预置,从而优化存储成本和性能。

首先,将 Amazon EBS CSI 驱动程序作为 EKS 插件安装到您的 HyperPod EKS 集群上,然后使用标准的 Kubernetes 持久性卷声明和存储类别预置 EBS 卷。EBS CSI 驱动程序管理 EBS 卷的完整生命周期,包括创建、附加、挂载和清理。支持使用客户自主管理型 KMS 密钥对卷进行加密,并且可以通过标准 Kubernetes 操作调整卷大小并创建快照。

此功能现已在支持 SageMaker HyperPod EKS 集群的所有 AWS 区域推出。要了解有关 EBS CSI 驱动程序支持的更多信息,请参阅 Amazon SageMaker HyperPod 用户指南