Amazon CloudWatch

AWS 和本地的 AWS 资源和应用程序的可观测性

Amazon CloudWatch 是一种面向开发运营工程师、开发人员、站点可靠性工程师 (SRE) 和 IT 经理的监控和可观测性服务。CloudWatch 为您提供相关数据和切实见解,以监控应用程序、响应系统范围的性能变化、优化资源利用率,并在统一视图中查看运营状况。CloudWatch 以日志、指标和事件的形式收集监控和运营数据,让您能够在统一查看在 AWS 和本地服务器上运行的资源、应用程序和服务。您可以使用 CloudWatch 检测环境中的异常行为、设置警报、并排显示日志和指标、执行自动化操作、排查问题,以及发现可确保应用程序
正常运行的见解。

Amazon CloudWatch:全面了解您的云资源和应用程序 (2:02)

优势

跨应用程序和基础设施的单一平台上的可观测性

现代应用程序(如在微服务架构上运行的应用程序)会以指标、日志和事件的形式生成大量数据。Amazon CloudWatch 让您可以在一个平台上,从在 AWS 和本地服务器上运行的所有 AWS资源、应用程序和服务收集、访问和关联这些数据,帮助您打破数据孤岛,从而轻松获得整个系统的可见性并快速解决问题。

在 AWS 和本地收集指标的最简单方法

使用 CloudWatch 可以轻松监控 AWS 资源和应用程序。它与 Amazon EC2、Amazon DynamoDB、Amazon S3、Amazon ECS、Amazon EKS 和 AWS Lambda 等 70 多种 AWS 服务原生集成,可自动发布频率为 1 分钟的详细指标和粒度高达 1 秒的自定义指标,以便您可以深入了解相关内容的日志。您还可以使用 CloudWatch 代理或 API 监控本地资源,以在混合云架构中使用 CloudWatch。

改善运营绩效和资源优化

借助 Amazon CloudWatch,您可以根据预定义的阈值或可识别指标中异常行为的机器学习算法设置警报和自动执行操作。例如,它可以自动启动 Amazon EC2 Auto Scaling,或者停止实例以减少超额计费。CloudWatch Events 还适用于无服务器,可使用 AWS LambdaA、Amazon SNS 和 AWS CloudFormation 等服务触发工作流。

获取运营可见性和见解

要想优化性能和资源利用率,您需要统一的运营视图、实时的粒度数据和历史参考内容。Amazon CloudWatch 可提供自动化控制面板、粒度为 1 秒的数据,并将指标存储和保留长达 15 个月。您还可以对数据执行指标数学运算,以获得运营和利用率见解;例如,您可以汇总整个 EC2 实例队列的使用数据。

从日志中获取可作为行动依据的见解

借助 CloudWatch,您可以了解、分析和直观显示日志,从而轻松排查运营问题。使用 CloudWatch Logs Insights,您仅需为运行的查询付费。它可以根据您的日志数量和查询复杂度进行扩展,从而在几秒钟内提供答案。此外,您还可以发布基于日志的指标、创建警报,在 CloudWatch 控制面板中将日志和指标关联起来,从而获得完全的运营可见性。

工作原理

CloudWatch 以日志、指标和事件的形式收集监控和运营数据,并使用自动化控制面板将其可视化,让您能够统一查看在 AWS 和本地运行的 AWS 资源、应用程序和服务。您可以关联指标和日志,以便更好地了解资源的运行状况和性能。您还可以根据指定的指标值阈值创建警报,或者根据机器学习算法监控异常指标行为。要想快速采取措施,您可以设置自动操作来帮助缩短解决问题的平均时间。例如,触发警报时通知您并自动启动 Auto Scaling。您还可以深入了解并分析指标、日志和轨迹,以便更好地了解如何提高应用程序性能。

Amazon CloudWatch 工作原理

使用案例

基础设施监控和问题排查

监控关键指标和日志、直观显示应用程序和基础设施堆栈、创建警报、将指标和日志关联起来以了解和解决 AWS 资源中导致性能问题的根本原因。这包括通过 Amazon ECS、AWS Fargate、Amazon EKS 和 Kubernetes 监控您的容器生态系统。

缩短平均解决时间

CloudWatch 可帮助您关联、可视化和分析指标和日志,因此您可以快速采取措施解决问题,并将其与 AWS X-Ray 的跟踪数据相结合,以实现端到端的可观测性。您还可以分析用户请求,以帮助加快问题排查和调试,并降低总体平均解决时间 (MTTR)。

主动资源优化

CloudWatch 警报会根据您指定的阈值或 CloudWatch 使用机器学习模型为您创建的阈值来监控您的指标值,从而检测异常行为。如果触发警报,CloudWatch 可以自动采取措施启用 Amazon EC2 Auto Scaling 或停止实例,以便您自动执行容量和资源规划。

应用程序监控

监控在 AWS(在 Amazon EC2、容器和无服务器上)或本地运行的应用程序。CloudWatch 在性能堆栈的每一层收集数据,包括自动化控制面板上的指标和日志。

日志分析

了解、分析并可视化日志,以解决运营问题并提高应用程序性能。您可以执行查询以帮助您快速有效地响应运营问题。如果出现问题,您可以使用专门构建的查询语言立即开始查询,以快速识别潜在原因。

“我们使用基于微服务的架构。Amazon CloudWatch 是一个即时解决方案,因为它无需设置或维护基础设施。CloudWatch 完全可以满足我们在扩展方面的需求,并免除了集成和管理多个工具的运营负担。对我们来说最大的优势是 MTTR(平均解决时间)得以缩短,这样我们的开发运营团队可以快速找到整个容器基础设施的问题。”

– CloudPassage 联合创始人兼工程副总裁 Vitaliy Geraymovych

客户

客户使用 Amazon CloudWatch 来提高运营性能、优化资源分配并缩短 MTTR。要了解组织如何使用 Amazon CloudWatch 的更多信息,请访问我们的客户页面。 

Mapbox

Mapbox 使用 Amazon CloudWatch 来提取多个数据源并监控关键工作负载。

阅读客户参考案例 >>

Pushpay

Pushpay 使用 Amazon CloudWatch Logs Insights 查询日志并降低运营复杂性。

阅读客户参考案例 >>

Rackspace

Rackspace 使用 Amazon CloudWatch Agent 监控虚拟机。 

阅读客户参考案例 >>

SendGrid

SendGrid 以原生方式使用 Amazon CloudWatch,而无需借助自我管理堆栈或第三方供应商。 

阅读客户参考案例 >>

CloudPassage

CloudPassage 将 Amazon CloudWatch 用于基于微服务的架构,以缩短平均解决时间。 

阅读客户参考案例 >>

ConnectWise

ConnectWise 使用 Amazon CloudWatch 监控容器、延迟、Web 服务器请求和传入的负载均衡器请求。 

阅读客户参考案例 >>

最新博客文章

更多…

目前没有可用的 Amazon CloudWatch 博客,请访问 AWS 博客页面。

新增功能 – Amazon CloudWatch Logs Insights – 快速交互式日志分析
作者:Jeff Barr
2018 年 11 月 27 日
 
How to better monitor your custom application metrics using Amazon CloudWatch Agent
作者:Helen Lin
2018 年 10 月 15 日
 

在 AWS 管理控制台之外构建 Amazon CloudWatch 控制面板
作者:Stephen McCurry
2018 年 10 月 2 日

阅读更多 »

使用 Amazon CloudWatch Events 构建无服务器管道
作者:Forrest Brazeal
2019 年 5 月 2 日

阅读更多 »

开始使用 AWS

创建免费 AWS 账户

注册 AWS 账户

立即享受 AWS 免费套餐
通过简单教程进行学习

通过 10 分钟教程进行学习

通过 简单教程进行探讨和学习。
开始在控制台中构建

开始在控制台中构建

开始使用分步指南进行构建来帮助您启动 AWS 项目

了解有关 Amazon CloudWatch 的更多信息

访问功能页面
准备好开始构建?
开始使用 Amazon CloudWatch
还有更多问题?
联系我们