Amazon SageMaker HyperPod 现已与 Amazon EventBridge 集成来提供状态变更事件

发布于: 2025年5月9日

Amazon SageMaker HyperPod 现已与 Amazon EventBridge 集成,可让您近乎实时地接收集群状态变更通知。利用此集成,您可以轻松跟踪关键事件,例如 HyperPod 集群状态转换和节点运行状况变更。

SageMaker HyperPod 通过 EventBridge 提供两种类型的通知:1.集群状态变更事件,当您的 HyperPod 集群在各种状态(例如“InService”或“Failed”)之间转换时,系统将向您发送通知。2. 节点运行状况事件,当节点运行状况变更(例如,运行状况良好/不佳)或在故障恢复期间被自动替换时,系统将向您发送通知。您也可以编写简单的 EventBridge 规则,以便在发生这些事件时触发自动操作。

通过 EventBridge 提供的 SageMaker HyperPod 事件现已在所有正式发布 SageMaker HyperPod 和 Amazon EventBridge 的 AWS 区域推出。

要详细了解 Amazon SageMaker HyperPod 与 EventBridge 的集成,请访问 Amazon SageMaker AI 文档