Amazon DevOps Guru

애플리케이션 가용성을 개선하는 ML 기반 클라우드 운영 서비스

Amazon DevOps Guru는 기계 학습(ML) 기반 서비스로서 애플리케이션의 운영 성능 및 가용성을 쉽게 개선할 수 있습니다. DevOps Guru는 정상적인 운영 패턴에서 벗어나는 동작을 탐지하므로 고객에게 영향을 미치기 훨씬 전에 운영 문제를 확인할 수 있습니다.

DevOps Guru는 오랫동안 Amazon.com 및 AWS 운영 우수성을 기반으로 축적된 기계 학습 모델을 사용함으로써 비정상적인 애플리케이션 동작(예: 지연 시간, 오류율, 리소스 제약 등의 증가)을 식별하고 가동 중단 또는 서비스 중단을 유발할 수 있는 중요한 문제를 탐지할 수 있습니다. DevOps Guru가 중요한 문제를 식별하면 자동으로 알림을 발송하면서 관련 이상 현상, 가능한 근본 원인 및 문제가 발생한 시기 및 위치에 대한 컨텍스트를 요약하여 제공합니다. DevOps Guru는 또한 가능한 경우에 문제를 해결하는 방법에 대한 권장 사항도 제공합니다.

DevOps Guru는 AWS 애플리케이션에서 운영 데이터를 자동으로 수집하며, 운영 데이터의 문제를 시각화할 수 있는 단일 대시보드를 제공합니다. DevOps Guru를 시작하면 수동 설정이나 기계 학습 전문 지식이 없어도 애플리케이션 가용성 및 신뢰성을 개선할 수 있습니다.

DevOps_Guru_Dashboard
Amazon DevOps Guru 대시보드
 확대하려면 클릭
DevOps_Guru_Dashboard

이점

2_icon_2_resolve_issues

운영 문제를 자동으로 탐지

Amazon DevOps Guru는 기계 학습을 사용함으로써 애플리케이션 지표, 로그 및 이벤트와 같은 데이터를 자동으로 수집 및 분석하여 정상적인 운영 패턴에서 벗어난 동작을 식별할 수 있습니다. 가동 중단, 메모리 누수, 부족하게 프로비저닝된 컴퓨팅 용량, 데이터베이스 I/O 과다 사용을 유발할 수 있는 임박한 리소스 고갈, 코드 및 구성 변경 등과 같은 운영 문제 및 위험을 자동으로 탐지하고 알립니다.

2_icon_1_auto_detect

ML 기반 인사이트로 신속하게 문제 해결

Amazon DevOps Guru는 비정상적인 동작과 운영 이벤트를 상호 연결하여 문제의 근본 원인을 식별하고 해결하는 시간을 절감할 수 있습니다. 문제가 발생하면 DevOps Guru는 관련 이상 현상 요약, 문제에 대한 컨텍스트 정보로 인사이트를 생성하고 가능한 경우 문제 해결을 위해 실행 가능한 권장 사항을 제공합니다.

2_icon_3_easily_scale

간편한 가용성 확장 및 유지

Amazon DevOps Guru는 정적 규칙 및 경보를 수동으로 업데이트하는 데 드는 시간과 노력을 절감할 수 있게 하며, 따라서 발전하는 복잡한 애플리케이션을 효과적으로 모니터링할 수 있습니다. 새로운 AWS 서비스를 마이그레이션하거나 채택하면 DevOps Guru는 그 지표, 로그 및 이벤트를 자동으로 분석합니다. 그런 다음 인사이트를 생성하며, 이를 통해 변화하는 동작 및 시스템 아키텍처에 쉽게 적응할 수 있습니다.

2_icon_4_reduce_noise

노이즈 및 경보 피로 감소


AmazonDevOps Guru는 사전 훈련된 기계 학습 모델을 사용하여 관련 이상 현상을 상호 연결 및 그룹화하고 가장 중요한 알림을 표시함으로써 개발자와 IT 운영자가 경보 노이즈를 줄이고 경보 피로를 극복할 수 있도록 지원합니다. DevOps Guru를 사용하면 여러 모니터링 도구 및 경보를 관리해야 할 필요성을 줄일 수 있으며, 이는 문제의 근본 원인 및 해결에 집중할 수 있다는 것을 의미합니다.

작동 방식

Amazon-DevOps-Guru_Diagram-V1_news
4_promo_icon


Amazon DevOps Guru 평가판

사용 사례

운영 감사

Amazon DevOps Guru를 사용하면 운영상 중요한 모든 이벤트를 빠르게 요약하여 심각도에 따라 식별 및 분류할 수 있습니다. 시스템 상태 대시보드를 사용하여 특정 애플리케이션의 문제를 검색하고 추세를 식별하며 개발자가 시간 및 리소스를 어디에 투입해야 하는지 결정할 수 있습니다.

사전 예방적인 리소스 고갈 계획 수립

메모리, CPU 및 디스크 공간과 같이 고갈 가능한 리소스에 대해 예측 경보를 구성합니다. Amazon DevOps Guru는 리소스 사용률이 프로비저닝 용량을 초과하는 시기를 예측하고 대시보드에 알림을 생성하여 사용자에게 통지함으로써 임박한 가동 중단을 예방할 수 있습니다.

예방적 유지 관리

Amazon DevOps Guru를 사용하면 인시던트가 발생하기 전에 예방할 수 있습니다. DevOps Guru는 심각하지 않을 수 있지만 방치되는 경우에 시간이 지나면서 악화되어 애플리케이션 가용성에 영향을 미칠 수 있는 중간 수준 및 낮은 심각도 탐지 결과를 플래그 표시합니다. 이를 통해 예기치 않은 가동 중단 시간의 우선순위를 지정하고 이를 예방할 수 있습니다. 예를 들어, DevOps Guru는 Auto Scaling 그룹의 한계에 도달하거나 지연 시간 패턴이 변경되거나 API 호출 볼륨이 증가하는 경우에 이를 알려줍니다. DevOps Guru는 또한 애플리케이션의 전반적인 가용성을 향상시키는 데 도움이 되는 AWS 모범 사례도 확인할 수 있습니다. 

고객

NextRoll
"우리는 수천 개의 EC2 인스턴스를 실행하고 있으며, 항상 팀이 운영 문제를 해결하는 데 투입하는 시간을 절감할 수 있는 방법을 찾고 있습니다. 흥미롭게도 우리는 Amazon DevOps Guru를 사용하고 그 ML 기반 인사이트를 활용함으로써 운영 문제를 식별, 상호 연결 및 해결하는 데 도움을 얻고 있습니다. 이를 통해 팀은 시간과 MTTR(평균 복구 시간)을 절감할 수 있습니다."

- Valentino Volonghi
CTO, NextRoll

SmugMug
"우리 팀은 평생 옵스(Ops-for-life)의 모토 하에 항상 수동 작업을 자동화할 수 있는 방법을 찾고 있습니다. Amazon DevOps Guru를 통해 우리는 그 목표를 실현하고 AIOps가 일상적인 많은 작업을 인계받도록 함으로써 당사 팀은 IT 혁신에 집중할 수 있기를 희망하고 있습니다. 현재 우리는 비즈니스 요구를 충족시킬 뿐만 아니라 가장 중요한 일에 더 많은 시간을 할애하여 회사 및 고객에게 가치를 제공함으로써 이 요구를 초과 달성할 수 있습니다."

- Andrew Shieh
SmugMug 운영 담당 이사

Thomson Reuters
"고객 경험은 당사에 매우 중요한 요소입니다. 고객에게 영향을 미칠 수 있는 인시던트를 예방 및 완화하는 과정에서 가용성, 성능 및 변경 요청에 대한 여러 소스의 경보를 처리하는 일은 어려운 작업일 수 있습니다. 흥미롭게도 우리는 Amazon DevOps Guru를 사용하고 ML 기반 인사이트를 활용함으로써 명확한 조치 경로를 제공하고 있습니다. 이를 통해 우리는 신속하게 문제를 완화하고 고객에게 영향을 미치는 이벤트를 예방할 수 있습니다. PagerDuty와의 통합은 보너스입니다. 이를 통해 적절한 사람들에게 적시에 효율적으로 권장 사항을 전달할 수 있습니다."

- Steve Thoennes
인프라 호스팅 포트폴리오 담당 이사

파트너

Atlassian
"Atlassian은 DevOps Guru 출시를 위해 Amazon을 지원하고 팀이 자신 있게 코드를 배포하고 서비스를 운영할 수 있도록 지원한 것을 자랑스럽게 생각합니다. DevOps Guru가 잠재적 문제를 예측하거나 인시던트가 발생했다고 결정하는 경우 이를 즉시 당사의 새로운 Opsgenie 및 Jira Service Management 통합을 통해 해당 팀에 알릴 수 있습니다. DevOps Guru는 새로운 차원의 인사이트를 제공하며, Atlassian은 가장 빠른 응답을 보장합니다."

- Emel Dogrusoz
제품 책임자, Opsgenie

PagerDuty
"PagerDuty는 전체 인시던트 응답 수명 주기를 해결 방법과 함께 자동화함으로써 DevOps 문화의 구현을 촉진할 수 있도록 제작되었습니다. 흥미롭게도 우리는 Amazon DevOps Guru와의 최신 통합을 통해 DevOps에 지속적으로 최선을 다하고 있습니다. Amazon이 수십 년 동안 축적한 운영 우수성과 DevOps Guru의 기계 학습 기능을 활용한 PagerDuty는 당사의 공동 고객들에게 실시간 효율을 훨씬 높인 신호 대 조치 기능을 제공하고 있습니다. PagerDuty가 DevOps Guru의 Amazon Simple Notification Service(SNS) 알림을 수집하는 기능을 통해 AWS 고객은 운영 문제가 고객에 영향을 미치는 가동 중단으로 악화되기 전에 이에 대한 조치를 실시간으로 취할 수 있습니다."

- Jonathan Rende
제품 부문 SVP

7_bottom_promo_icon

코드 검토 자동화
Amazon CodeGuru로 코드 문제를 조기에 더욱 신속하게 파악

Product-Page_Standard-Icons_01_Product-Features_SqInk
제품 기능 확인

정교한 개인화 기능을
애플리케이션에 쉽게 구축

자세히 알아보기 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입하기 
Product-Page_Standard-Icons_03_Start-Building_SqInk
콘솔에서 구축 시작

AWS Management Console에서 Amazon DevOps Guru를 사용하여 구축을 시작하세요.

로그인