수집

로그를 손쉽게 수집 및 저장

Amazon CloudWatch Logs 서비스를 사용하면 리소스, 애플리케이션 및 서비스로부터 거의 실시간으로 로그를 수집하고 저장할 수 있습니다. 로그는 세 가지 주요 카테고리로 나뉩니다. 1) Vended 로그. 고객을 대신하여 AWS 서비스가 기본적으로 게시하는 로그입니다. 현재 지원되는 유형은 Amazon VPC 흐름 로그와 Amazon Route 53 로그입니다. 2) AWS 서비스에서 게시하는 로그. 현재 30여 개의 AWS 서비스에서 CloudWatch로 로그를 게시합니다. 이러한 서비스에는 Amazon API Gateway, AWS Lambda, AWS CloudTrail 외 다수가 포함됩니다. 2) 사용자 지정 로그. 고객 자체 애플리케이션 및 온프레미스 리소스의 로그입니다. AWS Systems Manager를 사용하여 CloudWatch 에이전트를 설치하거나 PutLogData API 작업을 사용하여 손쉽게 로그를 게시할 수 있습니다.

내장된 지표

분산 애플리케이션(마이크로서비스 아키텍처를 사용하여 구축된 애플리케이션 등)에서 지표를 수집하려면 오랜 시간이 소요됩니다. Amazon CloudWatch를 사용하면 사용자가 별도의 작업을 수행하지 않고도 Amazon EC2, Amazon DynamoDB, Amazon S3, Amazon ECS, AWS Lambda, and Amazon API Gateway 등 70개가 넘는 AWS 서비스에서 기본 지표를 수집할 수 있습니다. 예를 들어 EC2 인스턴스는 상태 변경을 파악할 수 있도록 CPU 사용률, 데이터 전송 및 디스크 사용량 지표를 자동으로 게시합니다. API Gateway용으로 내장된 지표 7개 중 하나를 사용하여 지연 시간을 탐지하거나 AWS Lambda용으로 내장된 지표 8개 중 하나를 활용하여 오류와 병목을 탐지할 수 있습니다. 샤드 수준의 Amazon Kinesis Data Streams 지표와 같이 기본 지표 외에 좀 더 상세한 지표가 필요한 경우, 리소스별로 선택하면 됩니다.

사용자 지정 지표

Amazon CloudWatch를 사용하면 자체 애플리케이션으로부터 사용자 지정 지표를 수집하여 운영 성능을 모니터링하고 문제를 해결하고 추세를 파악할 수 있습니다. 사용자 활동은 일정 기간 동안 수집하고 모니터링할 수 있는 사용자 지정 지표의 한 예입니다. CloudWatch 에이전트 또는 PutMetricData API 작업을 사용하여 이러한 지표를 CloudWatch에 게시할 수 있습니다. 사용자 지정 지표 데이터에 대해서도 통계, 그래프, 경보를 비롯하여 모든 CloudWatch 기능이 최소 1초 간격으로 동일하게 제공됩니다.

모니터링

대시보드를 통한 통합된 운영 뷰

Amazon CloudWatch 대시보드를 사용하면 재사용 가능한 그래프를 생성하고 통합된 뷰에서 클라우드 리소스와 애플리케이션을 시각화할 수 있습니다. 하나의 대시보드에서 지표와 로그 데이터를 나란히 그래프로 표시하여 컨텍스트를 빠르게 확보하고 문제 진단에서 근본 원인 파악까지 진행할 수 있습니다. 예를 들어 CPU 사용률 및 메모리와 같은 주요 지표를 시각화하고 용량과 비교할 수 있습니다. 또한, 특정 지표의 로그 패턴을 상호 연관시키고 경보를 설정하여 성능 및 운영 문제에 대해 사전에 알림을 받도록 할 수 있습니다. 운영 상태에 대한 시스템 전반의 가시성과 문제를 신속하게 해결할 수 있는 기능을 제공하여 MTTR(Mean Time to Resolution)을 단축합니다.

고해상도 경보

Amazon CloudWatch 경보를 사용하면 지표에 대한 임계값을 설정하고 작업을 트리거할 수 있습니다. 고해상도 경보를 생성하고, 백분위수를 통계로 설정하고, 적절하게 작업을 지정 또는 무시할 수 있습니다. 예를 들어 Amazon EC2 지표에 대한 경보를 생성하고, 알림을 설정하고, 미사용 인스턴스 또는 사용률이 낮은 인스턴스를 탐지하고 종료하도록 하나 이상의 조치를 취할 수 있습니다. 지표 및 이벤트에 대한 실시간 경보를 사용하면 가동 중단과 잠재적 비즈니스 영향을 최소화할 수 있습니다.

로그와 지표 상관관계

애플리케이션 및 인프라 리소스는 로그와 지표의 형태로 많은 양의 운영 및 모니터링 데이터를 생성합니다. 단일 플랫폼에서 이러한 데이터 세트에 액세스하고 이를 시각화하는 기능을 제공하는 것 외에도 Amazon CloudWatch는 지표와 로그를 손쉽게 상호 연관시킬 수 있습니다. 이를 통해 문제 진단에서 근본 원인 파악까지 신속하게 진행할 수 있습니다. 예를 들어 오류와 같은 로그 패턴을 특정 지표와 상호 연관시키고 성능 및 운영 문제에 대해 사전에 알림을 받도록 경보를 설정할 수 있습니다.

조치

Auto Scaling

Auto Scaling은 용량 및 리소스 계획을 자동화하는 데 도움이 됩니다. 주요 지표에 대한 경보를 받고 자동화된 Auto Scaling 작업을 트리거하도록 임계값을 설정할 수 있습니다. 예를 들어 CPU 사용률 지표를 기반으로 EC2 인스턴스를 추가 또는 제거하도록 Auto Scaling 워크플로를 설정하여 리소스 비용을 최적화할 수 있습니다.

CloudWatch Events를 통해 운영 변경 사항에 대한 대응 자동화

CloudWatch Events는 AWS 리소스에 대한 변경 사항을 설명하는, 거의 실시간의 시스템 이벤트 스트림입니다. 이를 사용하면 운영 변경 사항에 신속하게 대응하고 시정 조치를 취할 수 있습니다. 애플리케이션에서 관심이 있는 이벤트가 무엇인지와 규칙이 이벤트와 일치할 때 자동으로 수행할 작업을 나타내는 규칙을 작성하기만 하면 됩니다. 예를 들어 AWS Lambda 함수를 호출하거나 Amazon Simple Notification Service(SNS) 주제를 알리는 규칙을 설정할 수 있습니다.

분석

세분화된 데이터 및 확장된 보존 기간

Amazon CloudWatch를 사용하면 15개월 분량의 지표 데이터(스토리지 및 보존)를 통해 추세와 계절적 변동을 모니터링할 수 있습니다. 이 데이터를 사용하면 기록 분석을 수행하여 리소스 사용률을 미세 조정할 수 있습니다. 또한, CloudWatch에서는 온프레미스 애플리케이션에서 수신되는 지표와 같은 사용자 지정 지표를 비롯하여 상태 지표를 최소 1초 간격으로 수집할 수 있습니다. 세분화된 실시간 데이터를 사용하면 추세를 파악하고 모니터링할 수 있는 기능과 시각화를 향상하여 애플리케이션 문제 및 운영 상태를 최적화할 수 있습니다.

지표에 대한 사용자 지정 작업

Amazon CloudWatch Metric Math를 사용하면 실시간 분석을 위해 여러 지표에 걸쳐 계산을 수행할 수 있으므로 기존 CloudWatch 지표에서 통찰력을 쉽게 이끌어내고 인프라의 운영 상태와 성능을 더 잘 이해할 수 있습니다. AWS Management Console에서 이렇게 계산된 지표를 시각화하고, 이를 CloudWatch 대시보드에 추가하거나 GetMetricData API 작업을 사용하여 검색할 수 있습니다. Metric Math에서는 +, -, /, * 등과 같은 산술 연산자와 Sum, Average, Min, Max, Standard Deviation 등과 같은 수학 함수를 지원합니다.

규정 준수 및 보안

Amazon CloudWatch는 AWS Identity and Access Management(IAM)와 통합되므로 데이터에 대한 액세스 권한이 있는 사용자 및 리소스 그리고 액세스 방법을 제어할 수 있습니다.

또한, Amazon CloudWatch Logs는 PCI 및 FedRamp 준수 서비스입니다. 데이터는 저장 및 전송 중 암호화됩니다. 또한, 추가적인 규정 준수 및 보안을 위해 AWS KMS 암호화를 사용하여 로그 그룹을 암호화할 수 있습니다.

Amazon CloudWatch Pricing 요금에 대해 자세히 알아보기

요금 페이지로 이동
구축할 준비가 되셨습니까?
Amazon CloudWatch 시작하기
질문이 있으십니까?
문의하기