发布于: Feb 25, 2022

Amazon CloudWatch 代理现在支持从运行 Linux 的 Amazon Elastic Compute Cloud (Amazon EC2) 加速计算实例收集 NVIDIA GPU 性能指标。基于 GPU 的实例通过数千个计算内核提供对 NVIDIA GPU 的访问。您可以使用这些实例加快科学、工程设计和渲染应用程序的速度。客户可以安装和配置 CloudWatch 代理,以便从 Amazon EC2、本地主机和容器化应用程序中收集系统和应用程序指标,并将它们发送到 CloudWatch。CloudWatch 为您提供数据和可指导行动的洞察,以监控您的应用程序并优化资源利用率。GPU 指标适用于想要监控其 EC2 加速实例中的 GPU 协同处理器利用率的用户。

使用 CloudWatch 代理,您现在可以收集 NVIDIA GPU 指标并将它们发送到 CloudWatch。GPU 指标可以帮助您确保经济、高效地使用 GPU 加速器。通过在 CloudWatch 控制面板上监控诸如 GPU 利用率和可用内存之类的指标,您可以识别出加速实例是利用过度还是不足,从而使您能够正确调整实例大小或预置其他主机。您可以使用 CloudWatch 异常检测功能发现异常情况,并通过 CloudWatch 警报接收通知。

Amazon CloudWatch 代理已在所有商业 AWS 区域和 AWS GovCloud(美国)中推出。

要开始使用,请参阅 Amazon CloudWatch 用户指南中的创建或编辑 CloudWatch 代理配置文件。要了解有关加速计算实例的更多信息,请参阅 Amazon EC2 用户指南中的 Linux 实例用户指南。有关 CloudWatch 功能的更多信息,请参阅 CloudWatch 用户指南