跳至主要内容

利用 AWS 云运维实现转型

利用 AWS 实现云运维转型

通过对应用程序和环境进行可视化呈现和分析,更快地进行调查、故障排除和修复

准备就绪,开始操作

AWS 可帮助简化云操作并缩短平均修复时间(MTTR)

加快运维调查

凭借对您的 AWS 云环境和资源的深入了解,Amazon CloudWatch 会与您协同调查问题。它会在您的环境中查找异常情况,并为您提供潜在的根本原因假设。该产品通过提供相关的 AWS Systems Manager Automation 运行手册和文档,对常见的 AWS 问题提出修复措施建议。

开始交互式演示               

观看完整演示

2Screenshot of a diagnostic tool suggesting a hypothesis for DynamoDB throttling due to a sudden spike in read and write operations, with highlighted text and four possible next steps listed.

浏览相关遥测数据

通过交互式拓扑图,轻松浏览和可视化 AWS 资源与工作负载之间的关系。Amazon CloudWatch 为可观测性数据增添背景信息,使您能够在单个视图中浏览相关指标和日志,而无需在控制台之间切换或筛选大量遥测数据。

2"CloudWatch dashboard showing a 'CPUUtilization High' alarm with a graph of CPU usage, alarm details, and a topology map of related resources including an EC2 instance and connected services."

解锁无缝的应用性能监控(APM)

使用完全托管且与 OpenTelemetry 兼容的 Amazon CloudWatch Application Signals,简化应用性能监控(APM)。

借助以应用程序为中心的 AWS 资源、服务、依赖项和服务级别目标(SLO)视图,轻松监控和分类应用程序运行状况。Amazon CloudWatch Application Signals 无需自定义代码,即可自动检测、跟踪和收集延迟、故障和错误等关键指标。

通过全面了解您的应用程序跨度和事务,更快地发现并解决最终用户的事务问题。查看从下单到完成购买的每一个步骤,并提供详细的可视化分析。您可以使用跨度分析来监控用户如何与应用程序的不同部分进行交互并进行故障排除。

开始交互式演示

观看完整演示

2Alt-text: "AWS CloudWatch Service Map showing the 'pet-clinic-frontend' service with 3/6 SLIs marked as unhealthy, including latency issues and availability problems, alongside metrics like requests, average latency, error rate, and fault rate."

简化运维和安全分析

在没有重复数据的情况下,获取对日志和安全数据的实时分析。利用 Amazon CloudWatch、Amazon Security Lake 和 Amazon OpenSearch Service 之间的集成分析体验,深入了解可观测性和安全数据。零 ETL 集成可根据实际使用情况和数据处理需求进行扩展,从而减少基础设施、开发和维护方面的工作。

使用 OpenSearch Service 管道处理语言(PPL)和 OpenSearch SQL 在 Amazon CloudWatch 中查询和分析日志数据,无需复杂的数据管道。Amazon CloudWatch 的客户可以借助针对 Amazon VPC、AWS CloudTrail 和 AWS WAF 等 AWS 服务的现成精选控制面板来加快故障排除。你还可以在不更改 Amazon CloudWatch Logs 设置的情况下,使用 Amazon OpenSearch Service 的高级分析和可视化功能。

开始交互式演示 — 运维分析

2"CloudWatch OpenSearch dashboard displaying metrics for web requests, including total requests (176 blocked, 165 allowed), line graph of request history, pie charts for ACL names and blocked rules, bar chart of sources, and a map of request origins."

管理在任何环境中运行的节点

使用 AWS Systems Manager,您可以在单一位置大规模自动化管理 AWS、多云及混合环境中的节点。集成到 Amazon Q 开发者版后,您可以从控制台中的任何位置控制节点。通过对托管和未托管节点的简化、全面且集中的视图,您能够在单一位置识别、诊断、打补丁并修复节点,从而提升运营效率。AWS Systems Manager 还与 Amazon Q 开发者版集成,使您能够在 AWS 管理控制台的任何位置查看和控制节点。

全面了解您组织的 AWS 账户和区域,查看全面的节点信息,包括实例详细信息、操作系统数据、已安装的代理和标签。

2Dashboard showing AWS Systems Manager node insights with charts for node summary, managed node types, SSM Agent versions, and managed node operating systems.

优势

    AWS 的运营经验和规模远超任何其他云提供商,17 年来一直为全球数百万客户提供云服务。Amazon CloudWatch 的调查功能内置了这种体验,可为您创建和提供调查假设,并指导您进行故障排除和修复。

    在从问题分类到修复的整个故障排除过程中,Amazon CloudWatch 会与您协同调查问题,从而节省在寻找根本原因上花费的时间。

    利用自动资源关系映射和交互式拓扑视图,将不同的遥测数据转化为实时见解。从高级服务无缝导航到单个指标,同时维护全系统上下文。通过预构建的控制面板和自动检测可立即查看关键指标,而集成的 OpenSearch 功能无需额外设置即可实现分析和可视化。

    使用多种查询语言(包括 SQL 和 OpenSearch PPL)增强分析能力,进行复杂的日志分析。无需更改现有设置,即可直接在 Amazon CloudWatch 内访问 Amazon OpenSearch Service 功能。通过零 ETL 集成消除单独的数据管道和存储成本,实现高效的日志分析和可视化,同时优化运营成本。

    使用 AWS Systems Manager,增强对组织的 AWS 账户和区域中托管式和非托管式节点的可见性。您可以在 AWS、本地和多云环境中运行操作任务并自动安装操作系统和软件补丁。

了解 AWS 如何帮助提高运营洞察力和效率

Amazon Kindle

Amazon Kindle 的支持工程师在使用 Amazon CloudWatch 进行问题调查时,问题解决速度提升了 65-80%,这有助于他们更快地满足客户需求,从而提供最佳用户体验。

Missing alt text value

Cedar Gate Technologies

医疗技术提供商 Cedar Gate Technologies 现在借助 Amazon CloudWatch 来加快调查速度并快速解决问题,将识别运营问题根本原因的时间从两小时缩短至约 30 分钟,从而确保客户能够持续为患者提供有价值的护理服务。

Missing alt text value

CCC

“CloudWatch 可观测性平台提高了团队对应用程序性能的可见性,简化并加速了团队的协作。该平台提供对应用程序性能的实时见解以及全面的端到端分析,让团队能够制定更明智的数据驱动型决策。因此,我们可以更高效、更主动地维护和管理绩效,让我们的团队能够专注于追求创新和卓越,助力团队和客户生活得更好。”

CCC 站点可靠性工程技术与数据库运营副总裁 Subrat Mishra

Missing alt text value

Yayoi

“借助新的集成分析体验以及 Amazon CloudWatch 和 Amazon OpenSearch Service 之间的零 ETL 集成,Yayoi 不再需要从 Amazon CloudWatch 复制日志进行分析,也不必创建 ETL 管道。现在,我们可以使用 OpenSearch Discover 就地分析 Amazon CloudWatch 日志,并在 Amazon CloudWatch Logs 上构建索引和控制面板。”

Yayoi 服务平台部 Kazuma Imaizumi

Missing alt text value

Amazon Music

Amazon Music 的开发人员正在使用 Amazon CloudWatch 作为全天候助手来自动执行调查并识别问题趋势,这有助于他们在待命轮班期间更快采取行动。早期的使用表明,Amazon Music 解决问题的速度是原来的两倍,因此听众可以继续欣赏自己喜欢的歌曲。

Missing alt text value

Works Human Intelligence

“利用 Amazon CloudWatch 和 Amazon OpenSearch Service 之间新的集成分析体验和零 ETL 集成,Works Human Intelligence 可以为 VPC 流日志和 CloudTrail 创建开箱即用的 OpenSearch 控制面板。这有助于我们使用源自日志的可视化效果进行监控、分析和故障排除。”

Works Human Intelligence 工程经理 Akito Kidani

Missing alt text value

Intercom

“使用 AWS Systems Manager 每年可为我们的工程师节约数百小时,补丁管理完全自动化,并可自动修复中断运行的主机。我们将 Amazon CloudWatch 用于日常自动扩展,以及资源利用率管理和跟踪。通过 AWS CloudTrail,我们可以审核日志的变更,使我们能够满足合规性要求。使用 AWS Config,我们可以轻松地显示和导航我们环境中的配置变更时间表。总体上,管理与监管服务让我们能够大规模地确立安全管理,同时节省成本。”

Intercom 首席系统工程师 Brian Scanlan

Missing alt text value

HENNGE

“Amazon CloudWatch 和 Amazon OpenSearch Service 之间的集成彻底改变了我们的工作方式! 我们的团队已经习惯使用 OpenSearch 管道处理语言(PPL)和 SQL,因此在 Amazon CloudWatch Logs Insights 中使用 PPL/SQL 的学习曲线微乎其微。我们可以更快地进行故障排除,且控制面板可以轻松地从我们的日志中发现趋势和潜在问题。这意味着梳理数据的时间减少,可以将更多的时间集中在重要的事情上。”

HENNGE 云产品部副部门经理 Michael Wangsa

Missing alt text value