메인 콘텐츠로 건너뛰기

Amazon CloudWatch

AI Operations

AI를 활용해 신속하게 운영 문제 식별, 진단, 수정

개요

AWS가 19년 넘는 세월 동안 전 세계 수백만 고객에게 클라우드 서비스를 제공하면서 축적하고 개선해 온 광범위한 운영 경험을 활용하세요. 클라우드 운영 프로세스를 개선, 가속화, 자동화하는 데 도움이 되는 AI 및 기계 학습(ML)을 적용했습니다. AIOps를 사용하면 워크로드를 손쉽게 관찰하고 운영 문제 해결 속도를 높이며 운영 문제를 해결 및 수정하는 데 행동을 취할 수 있어 평균 복구 시간(MTTR)이 개선됩니다. 

짧은 시간 내에 문제의 근본 원인 찾기

AWS Management Console 내 어느 위치에서든 운영 조사를 시작할 수 있습니다. 경보가 울리는 즉시 조사를 시작하도록 Amazon CloudWatch를 구성하거나 Amazon Q 채팅에서 조사를 생성할 수 있습니다. CloudWatch는 조사에 참여하여 애플리케이션의 문제 현상을 식별하고 문제의 근본 원인에 대한 가설을 세울 수 있도록 지원합니다.

CloudWatch 조사 대화형 데모 시작

Missing alt text value

문제 해결 제안을 사용하여 신속하게 문제를 해결

Amazon CloudWatch는 관련 AWS Systems Manager Automation 런북, AWS re:Post 문서, 설명서를 제공하여 일반적인 AWS 문제에 대한 문제 해결 조치를 제안합니다. 런북을 실행해 문제를 해결하여 비즈니스 크리티컬 애플리케이션이 신속하게 온전한 운영 상태로 복귀하도록 하세요.

Amazon CloudWatch 조사에 관한 설명서 내용 읽기

Missing alt text value

지속적인 운영 태세 개선

Amazon CloudWatch는 AI를 이용해 몇 분 만에 종합적인 인시던트 사후 분석 보고서를 생성합니다. 인시던트 보고서는 패턴을 더 효과적으로 파악하고, 예방 조치를 구현하고, 체계적인 인시던트 사후 분석을 통해 운영 태세를 지속적으로 개선하는 데 도움이 됩니다. 중요한 운영 원격 측정, 서비스 구성, 조사 결과를 자동으로 수집하고 상관 관계를 정립해 운영 개선의 동인이 되는 상세한 보고서를 생성하세요.  

자동 인시던트 분석 및 보고에 관해 설명서에서 자세히 알아보기

Missing alt text value

경험 수준과 관계없이 모든 운영자 지원

Amazon CloudWatch는 문제 해결 프로세스 중 힘든 부분을 맡아 주므로, 사용자가 애플리케이션 리소스의 모든 부분에 대한 전문가가 아니어도 됩니다. CloudWatch는 운영 조사를 진행하면서 수십만 개의 데이터 포인트를 샅샅이 살펴보고 서비스 간 관계를 알아내며, 이러한 서비스가 어떻게 함께 작동하는지 이해합니다. CloudWatch는 조사 결과를 분석한 다음 문제의 근본 원인이 무엇일지 잠재적 가설을 제시하고, 어떻게 해결하면 좋을지 안내합니다.

샘플 조사 보기

Missing alt text value

이상 및 패턴 자동으로 탐지

Amazon CloudWatch는 고급 기계 학습(ML)을 사용해 원격 측정 데이터의 기준을 자동으로 설정하고 이상을 탐지하기 때문에 사용자가 지표와 로그를 수동으로 걸러낼 필요가 없습니다. 패턴 급증이나 비정상적인 패턴에 대한 알림을 받아 문제가 커지기 전에 해결하세요. CloudWatch는 반복되는 패턴이나 심각도 수준과 같은 중요한 값을 강조 표시하여 사용자가 신속하게 관련 로그에 집중하거나 장기적인 동작을 비교해 문제를 더 빨리 찾아내는 데 도움이 됩니다.

CloudWatch 이상 탐지에 관한 설명서 내용 읽기

Missing alt text value

자연어를 사용한 원격 측정 데이터 쿼리

복잡한 쿼리 언어를 배울 필요 없이 원격 측정에서 인사이트를 추출하세요. 복잡한 쿼리를 쓰지 않고 평소 쓰는 말, 예를 들어 “지난 24시간 동안 가장 속도가 느렸던 AWS Lambda 요청 10개를 표시해 줘”와 같이 질문하면 Amazon CloudWatch가 자동으로 올바른 구문을 생성합니다. CloudWatch Logs Insights의 자연어 요약 기능을 사용하면 쿼리 결과의 요약을 생성할 수 있어 로그 데이터에서 신속하게 문제를 파악하고, 실행 가능한 인사이트를 얻을 수 있습니다.

자연어 쿼리자연어 요약 사용 방법에 관한 설명서 내용 읽기

Missing alt text value

고객

Cedar Gate Technologies

의료 기술 제공업체인 Cedar Gate Technologies는 이제 Amazon CloudWatch를 사용하여 조사를 가속화하고 문제를 신속하게 해결함으로써 두 시간이 걸리던 운영 문제의 근본 원인을 약 30분 만에 식별할 수 있게 되었습니다. 따라서 고객들이 환자에게 가치 있는 치료를 지속적으로 제공할 수 있습니다.

Missing alt text value

Amazon Kindle

Amazon Kindle 지원 엔지니어는 Amazon CloudWatch를 문제 조사 작업에 사용하면서 65~80% 더 빠르게 문제를 해결했으며, 이를 통해 고객의 니즈를 더 빠르게 해결하여 최상의 사용자 경험을 제공할 수 있었습니다. 

Missing alt text value

Amazon Music

Amazon Music 개발자들은 연중무휴 24시간 Amazon CloudWatch를 어시스턴트로 사용하여 문제 전반의 조사를 자동화하고 추세를 파악하여 근무 중 더 빠르게 업무를 진행하고 있습니다. 초기 사용 결과, Amazon Music은 청취자가 좋아하는 노래를 계속 즐길 수 있도록 문제를 두 배 빠르게 해결하는 것으로 나타났습니다.

Missing alt text value

SmugMug

사진 관리 플랫폼인 SmugMug에서는 Amazon CloudWatch를 이용해 시스템 전반의 지표, 로그, 운영 이벤트를 자동으로 분석하여 대부분의 문제를 20분 안에, 전보다 최대 50% 빠른 속도로 진단하고자 합니다. 이렇게 하면 수동 로그 검색을 줄여 운영 효율을 높일 수 있으므로 팀원들이 문제에 대처하는 데 할애하는 시간과 리소스를 줄이고, 대신 사진작가 사용자들이 디지털 스토어프런트를 성장시키는 데 도움이 되는 플랫폼을 구축하는 데 몰두할 수 있습니다.

Missing alt text value