Amazon DevOps Guru

애플리케이션 가용성을 개선하는 ML 기반 클라우드 운영 서비스

Amazon DevOps Guru는 기계 학습(ML) 기반 서비스로서 애플리케이션의 운영 성능 및 가용성을 쉽게 개선할 수 있습니다. DevOps Guru는 정상적인 운영 패턴에서 벗어나는 동작을 탐지하므로 고객에게 영향을 미치기 훨씬 전에 운영 문제를 확인할 수 있습니다.

DevOps Guru는 오랫동안 Amazon.com 및 AWS 운영 우수성을 기반으로 축적된 기계 학습 모델을 사용함으로써 비정상적인 애플리케이션 동작(예: 지연 시간, 오류율, 리소스 제약 등의 증가)을 식별하고 가동 중단 또는 서비스 중단을 유발할 수 있는 중요한 문제를 탐지할 수 있습니다. DevOps Guru가 중요한 문제를 식별하면 자동으로 알림을 발송하면서 관련 이상 현상, 가능한 근본 원인 및 문제가 발생한 시기 및 위치에 대한 컨텍스트를 요약하여 제공합니다. DevOps Guru는 또한 가능한 경우에 문제를 해결하는 방법에 대한 권장 사항도 제공합니다.

DevOps Guru는 AWS 애플리케이션에서 운영 데이터를 자동으로 수집하며, 운영 데이터의 문제를 시각화할 수 있는 단일 대시보드를 제공합니다. DevOps Guru를 시작하면 수동 설정이나 기계 학습 전문 지식이 없어도 애플리케이션 가용성 및 신뢰성을 개선할 수 있습니다.

Amazon DevOps Guru란 무엇입니까?

이점

2_icon_2_resolve_issues

운영 문제를 자동으로 탐지

Amazon DevOps Guru는 기계 학습을 사용함으로써 애플리케이션 지표, 로그 및 이벤트와 같은 데이터를 자동으로 수집 및 분석하여 정상적인 운영 패턴에서 벗어난 동작을 식별할 수 있습니다. 가동 중단, 메모리 누수, 부족하게 프로비저닝된 컴퓨팅 용량, 데이터베이스 I/O 과다 사용을 유발할 수 있는 임박한 리소스 고갈, 코드 및 구성 변경 등과 같은 운영 문제 및 위험을 자동으로 탐지하고 알립니다.

2_icon_1_auto_detect

ML 기반 인사이트로 신속하게 문제 해결

Amazon DevOps Guru는 비정상적인 동작과 운영 이벤트를 상호 연결하여 문제의 근본 원인을 식별하고 해결하는 시간을 절감할 수 있습니다. 문제가 발생하면 DevOps Guru는 관련 이상 현상 요약, 문제에 대한 컨텍스트 정보로 인사이트를 생성하고 가능한 경우 문제 해결을 위해 실행 가능한 권장 사항을 제공합니다.

2_icon_3_easily_scale

간편한 가용성 확장 및 유지

Amazon DevOps Guru는 정적 규칙 및 경보를 수동으로 업데이트하는 데 드는 시간과 노력을 절감할 수 있게 하며, 따라서 발전하는 복잡한 애플리케이션을 효과적으로 모니터링할 수 있습니다. 새로운 AWS 서비스를 마이그레이션하거나 채택하면 DevOps Guru는 그 지표, 로그 및 이벤트를 자동으로 분석합니다. 그런 다음 인사이트를 생성하며, 이를 통해 변화하는 동작 및 시스템 아키텍처에 쉽게 적응할 수 있습니다.

2_icon_4_reduce_noise

노이즈 및 경보 피로 감소


AmazonDevOps Guru는 사전 훈련된 기계 학습 모델을 사용하여 관련 이상 현상을 상호 연결 및 그룹화하고 가장 중요한 알림을 표시함으로써 개발자와 IT 운영자가 경보 노이즈를 줄이고 경보 피로를 극복할 수 있도록 지원합니다. DevOps Guru를 사용하면 여러 모니터링 도구 및 경보를 관리해야 할 필요성을 줄일 수 있으며, 이는 문제의 근본 원인 및 해결에 집중할 수 있다는 것을 의미합니다.

작동 방식

Amazon-DevOps-Guru_Diagram-V1_news
4_promo_icon


Amazon DevOps Guru 평가판

사용 사례

운영 감사

Amazon DevOps Guru를 사용하면 운영상 중요한 모든 이벤트를 빠르게 요약하여 심각도에 따라 식별 및 분류할 수 있습니다. 시스템 상태 대시보드를 사용하여 특정 애플리케이션의 문제를 검색하고 추세를 식별하며 개발자가 시간 및 리소스를 어디에 투입해야 하는지 결정할 수 있습니다.

사전 예방적인 리소스 고갈 계획 수립

메모리, CPU 및 디스크 공간과 같이 고갈 가능한 리소스에 대해 예측 경보를 구성합니다. Amazon DevOps Guru는 리소스 사용률이 프로비저닝 용량을 초과하는 시기를 예측하고 대시보드에 알림을 생성하여 사용자에게 통지함으로써 임박한 가동 중단을 예방할 수 있습니다.

예방적 유지 관리

Amazon DevOps Guru를 사용하면 인시던트가 발생하기 전에 예방할 수 있습니다. DevOps Guru는 심각하지 않을 수 있지만 방치되는 경우에 시간이 지나면서 악화되어 애플리케이션 가용성에 영향을 미칠 수 있는 중간 수준 및 낮은 심각도 탐지 결과를 플래그 표시합니다. 이를 통해 예기치 않은 가동 중단 시간의 우선순위를 지정하고 이를 예방할 수 있습니다. 예를 들어, DevOps Guru는 Auto Scaling 그룹의 한계에 도달하거나 지연 시간 패턴이 변경되거나 API 호출 볼륨이 증가하는 경우에 이를 알려줍니다. DevOps Guru는 또한 애플리케이션의 전반적인 가용성을 향상시키는 데 도움이 되는 AWS 모범 사례도 확인할 수 있습니다. 

고객

NextRoll
"우리는 수천 개의 EC2 인스턴스를 실행하고 있으며, 항상 팀이 운영 문제를 해결하는 데 투입하는 시간을 절감할 수 있는 방법을 찾고 있습니다. 흥미롭게도 우리는 Amazon DevOps Guru를 사용하고 그 ML 기반 인사이트를 활용함으로써 운영 문제를 식별, 상호 연결 및 해결하는 데 도움을 얻고 있습니다. 이를 통해 팀은 시간과 MTTR(평균 복구 시간)을 절감할 수 있습니다."

- Valentino Volonghi
CTO, NextRoll

SmugMug
"우리 팀은 평생 옵스(Ops-for-life)의 모토 하에 항상 수동 작업을 자동화할 수 있는 방법을 찾고 있습니다. Amazon DevOps Guru를 통해 우리는 그 목표를 실현하고 AIOps가 일상적인 많은 작업을 인계받도록 함으로써 당사 팀은 IT 혁신에 집중할 수 있기를 희망하고 있습니다. 현재 우리는 비즈니스 요구를 충족시킬 뿐만 아니라 가장 중요한 일에 더 많은 시간을 할애하여 회사 및 고객에게 가치를 제공함으로써 이 요구를 초과 달성할 수 있습니다."

- Andrew Shieh
SmugMug 운영 담당 이사

Thomson Reuters
"고객 경험은 당사에 매우 중요한 요소입니다. 고객에게 영향을 미칠 수 있는 인시던트를 예방 및 완화하는 과정에서 가용성, 성능 및 변경 요청에 대한 여러 소스의 경보를 처리하는 일은 어려운 작업일 수 있습니다. 흥미롭게도 우리는 Amazon DevOps Guru를 사용하고 ML 기반 인사이트를 활용함으로써 명확한 조치 경로를 제공하고 있습니다. 이를 통해 우리는 신속하게 문제를 완화하고 고객에게 영향을 미치는 이벤트를 예방할 수 있습니다. PagerDuty와의 통합은 보너스입니다. 이를 통해 적절한 사람들에게 적시에 효율적으로 권장 사항을 전달할 수 있습니다."

- Steve Thoennes
인프라 호스팅 포트폴리오 담당 이사

파트너

Atlassian
"Atlassian은 DevOps Guru 출시를 위해 Amazon을 지원하고 팀이 자신 있게 코드를 배포하고 서비스를 운영할 수 있도록 지원한 것을 자랑스럽게 생각합니다. DevOps Guru가 잠재적 문제를 예측하거나 인시던트가 발생했다고 결정하는 경우 이를 즉시 당사의 새로운 Opsgenie 및 Jira Service Management 통합을 통해 해당 팀에 알릴 수 있습니다. DevOps Guru는 새로운 차원의 인사이트를 제공하며, Atlassian은 가장 빠른 응답을 보장합니다."

- Emel Dogrusoz
제품 책임자, Opsgenie

Amazon DevOps Guru와 Atlassian Opsgenie를 통합하여 비상 대기 팀에 운영 인사이트를 직접 제공하는 방법을 알아보세요.
PagerDuty
"PagerDuty는 전체 인시던트 응답 수명 주기를 해결 방법과 함께 자동화함으로써 DevOps 문화의 구현을 촉진할 수 있도록 제작되었습니다. 흥미롭게도 우리는 Amazon DevOps Guru와의 최신 통합을 통해 DevOps에 지속적으로 최선을 다하고 있습니다. Amazon이 수십 년 동안 축적한 운영 우수성과 DevOps Guru의 기계 학습 기능을 활용한 PagerDuty는 당사의 공동 고객들에게 실시간 효율을 훨씬 높인 신호 대 조치 기능을 제공하고 있습니다. PagerDuty가 DevOps Guru의 Amazon Simple Notification Service(SNS) 알림을 수집하는 기능을 통해 AWS 고객은 운영 문제가 고객에 영향을 미치는 가동 중단으로 악화되기 전에 이에 대한 조치를 실시간으로 취할 수 있습니다."

- Jonathan Rende
제품 부문 SVP

PagerDuty와 Amazon DevOps Guru를 통해 비상 대기 팀에 기계 학습 기반의 운영 인사이트를 제공하는 방법을 자세히 알아보세요.

블로그 게시물 및 기사 >>

devops guru 1a

신규- 애플리케이션 오류와 수정 사항을 파악하는 데 도움을 주는 Amazon DevOps Guru

2020년 12월

Harunobu Kameda

블로그 읽기

devops guru 2

AWS CloudFormation StackSets를 사용하여 여러 계정과 리전에 걸쳐 Amazon DevOps Guru를 손쉽게 구성할 수 있습니다.

2020년 12월

Nikunj Vaidya, Nuatu Tseggai

블로그 읽기

devops guru reinvent thumbnail

AWS re:Invent 2020: Amazon DevOps Guru가 제공하는 기계 학습 기반 인사이트로 애플리케이션 가용성 개선

2020년 12월

Jacob Sullivan

웨비나 보기

devops guru 4

Amazon DevOps Guru는 운영 효율성을 인코딩하는 사전 훈련된 기계 학습 모형을 기반으로 합니다.

2020년 2월

Caner Turkmen, Ravi Turlapati, Tim Januschowski

블로그 읽기

7_bottom_promo_icon

코드 검토 자동화
Amazon CodeGuru로 코드 문제를 조기에 더욱 신속하게 파악

Standard Product Icons (Features) Squid Ink
제품 기능 확인

정교한 개인화 기능을
애플리케이션에 쉽게 구축

자세히 알아보기 
Sign up for a free account
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입하기 
Standard Product Icons (Start Building) Squid Ink
콘솔에서 구축 시작

AWS Management Console에서 Amazon DevOps Guru를 사용하여 구축을 시작하세요.

로그인