Amazon ElastiCache 新增 13 项 Amazon CloudWatch 指标,用于网络容量规划和引擎诊断
发布于:
2026年5月5日
Amazon ElastiCache 客户现在可以使用针对基于节点的集群推出的 13 项新 Amazon CloudWatch 指标来检测网络节流、内存碎片化和连接耗尽等问题。您可以直接从 CloudWatch 监控这些主机级和引擎级诊断,而无需在各个节点上运行 INFO 命令,也无需根据原始字节计数器计算基准。
- 网络容量:NetworkBaselineUsageInPercentage、NetworkBaselineUsageOutPercentage、NetworkBaselineMaxUsageInPercentage 和 NetworkBaselineMaxUsageOutPercentage 会报告相对于实例基准的网络利用率,从而使便携式警报在实例类型更改后保持有效。高于 100% 的值表明主机正在消耗突增积分,这是持续工作负载最终将导致积分耗尽和节流的一个主要指标。捕获平均指标可能会隐藏的每秒最大报告突增量的变体。
- 内存运行状况:UsedMemoryDataset 显示实际存储数据消耗的内存,不包括引擎开销。AllocatorFragmentationBytes 和 AllocatorFragmentationRatio 可隔离 activedefrag 参数可以解决的碎片化问题。MajorPageFaults 捕获操作系统级别的页面错误,这些错误表明内存压力超出了引擎所能承受的范围。
- 连接运行状况:BlockedConnections 和 RejectedConnections 分别显示等待阻止命令的连接,以及在达到 maxclients 限制时被拒绝的连接。当 RejectedConnections 不为零时,应提高 maxclients 值或排查客户端连接池泄漏问题。
- 发布/订阅工作负载:PubSubChannels 和 PubSubShardChannels 分别显示每个节点上的活跃经典通道和分片通道。当经典通道数量随着利用率的增长而增加时,可以考虑切换到分片发布/订阅以实现水平扩展。
- 命令吞吐量:ProcessedCommands 提供所有命令类型的总命令吞吐量。
这些指标适用于所有支持 ElastiCache 的 AWS 商业区域、AWS 中国区域以及 AWS GovCloud(美国)区域中基于节点的集群,且无需额外费用。
要开始使用,请在 ElastiCache 控制台的监控选项卡或 CloudWatch 控制台的 AWS/ElastiCache 命名空间中查看新指标。要了解更多信息,请参阅主机级指标和 Valkey 和 Redis OSS 的指标。