宣布推出 Amazon EKS 的节点运行状况监控和自动修复

发布于: 2024年12月16日

Amazon Elastic Kubernetes Service (Amazon EKS) 现在会监控 EKS 集群中 EC2 实例(节点)的运行状况,以了解特定于 Kubernetes 的运行状况问题,并在它们运行不正常时自动采取措施进行修复。这有助于提高 Kubernetes 应用程序的可用性,并减少保持集群基础设施最佳性能所需的运营开销。

管理运行 Kubernetes 应用程序的节点以确保它们能够具备错误恢复能力,是一项具有挑战性的工作,也是一项操作密集型工作。此次发布通过持续监控 EKS 集群内节点的运行状况、自动检测运行状况问题并在出现问题时更换节点,简化了集群基础设施的维护。您可以通过在新的或现有的 EKS 集群中安装新的 EKS 节点监控代理附加组件,然后在 EKS 托管节点组 API 或 AWS 管理控制台中启用节点自动修复,从而启用此功能的运行状况监控和修复功能。EKS 自动模式同时启用了节点监控代理和节点自动修复功能。

EKS 节点运行状况监控和自动修复现已在所有 AWS 区域(AWS GovCloud(美国)和中国区域除外)免费提供。

要了解更多信息并开始使用,请访问 Amazon EKS 产品页面Amazon EKS 用户指南中的“节点运行状况监控和修复”