메인 콘텐츠로 건너뛰기

AWS DevOps 에이전트

AWS DevOps 에이전트

인시던트를 선제적으로 해결하고 예방하는 자율 AI 에이전트로 운영 우수성을 높이세요.

AWS DevOps 에이전트를 선택해야 하는 이유

AWS DevOps 에이전트는 인시던트를 해결 및 사전에 예방하고, 애플리케이션 신뢰성 및 성능을 최적화하고, AWS/멀티클라우드/온프레미스 환경 전반에서 온디맨드 SRE 태스크를 처리하는 상시 이용 가능한 운영 팀원입니다. 모든 환경에 걸쳐 숙련된 DevOps 엔지니어처럼 애플리케이션과 그 관계를 학습하고, 관찰성 도구, 런북, 코드 리포지토리, CI/CD 파이프라인을 사용하여 작업하고, 텔레메트리, 코드, 배포 데이터의 상관관계를 분석하여 애플리케이션 리소스 간의 관계를 파악하는 방식을 통해 인시던트를 조사하고 운영 개선점을 식별합니다. 질문하고, 맥락에 맞는 답변을 즉시 얻고, 사용자 지정 차트와 보고서를 만들어 저장하고 팀원들과 공유하세요.

장점

    AWS DevOps 에이전트는 상시 대기 중인 자율 상주 엔지니어입니다. 애플리케이션을 최적의 성능으로 신속하게 복원하기 위해, AWS DevOps 에이전트는 오전 2시든 사용량이 많은 시간이든 상관하지 않고 경고가 들어오는 순간을 조사하기 시작합니다. AWS DevOps 에이전트는 연중무휴 24시간 인시던트를 자율적으로 분류하여 근본 원인 분석과 해결을 위한 조치를 제공합니다. 애플리케이션 리소스와 관계에 대한 이해를 바탕으로 종속성과 상호 작용을 빠르게 이해합니다. AWS DevOps 에이전트는 Slack, ServiceNow 및 PagerDuty 등 사용자가 선호하는 통신 채널을 통해 관찰 내용, 조사 결과 및 완화 단계를 자동으로 라우팅하여 인시던트 대응을 간소화합니다.

    AWS DevOps 에이전트는 과거 인시던트의 패턴을 분석하여 관찰성, 인프라 최적화, 배포 파이프라인 개선, 애플리케이션 복원력이라는 네 가지 주요 영역을 강화하는 실행 가능한 권장 사항을 제공합니다. 권장 사항에는 애플리케이션 또는 인프라 코드를 업데이트하기 위해 코딩 에이전트나 동료에게 구현을 넘길 수 있는 에이전트 지원 사양이 포함됩니다. 따라서 백로그를 관리할 필요 없이 지속적인 개선이 가능합니다.

    AWS DevOps 에이전트를 사용하면 워크플로 및 관찰 도구, 런북, 코드 리포지토리, CI/CD 파이프라인과 안전하게 통합하여 운영 데이터의 숨은 인사이트를 이용할 수 있습니다. AWS DevOps 에이전트는 Amazon CloudWatch, Dynatrace, Datadog, Grafana, New Relic, Splunk와 같은 관찰성 도구, 코드 리포지토리와 Azure DevOps, GitHub, GitLab 등의 CI/CD 파이프라인과 기본적으로 통합됩니다. 프라이빗 또는 원격 MCP 서버에 안전하게 연결하여 조직의 사용자 지정 도구, 특수 플랫폼 또는 독점 티켓 시스템과 같은 추가 도구와의 통합을 지원함으로써 AWS DevOps 에이전트를 기본 제공 통합 이상으로 확장할 수 있습니다.

    AWS DevOps 에이전트는 환경에 대한 심층적인 이해를 활용하므로, 단순히 질문하는 것을 넘어 애플리케이션 환경을 더 자세히 분석하고, 사용자 지정 차트와 보고서를 생성, 저장, 공유할 수 있습니다. 자연어 인터페이스를 통해 리소스 상태를 쿼리하고, 사고 패턴을 조사하고, 배포를 추적하고, 예방 권장 사항을 탐색합니다. 운영 지표를 추적하고 팀에 인사이트를 전달하는 데 도움이 되는 사용자 지정 차트와 보고서를 생성, 저장 및 공유합니다.

고객

United Airlines

“United Airlines는 매일 50만 명 이상의 승객을 수송합니다. 하이브리드 클라우드 환경, 500개 이상의 AWS 계정, 20,000개의 AWS Lambda 함수, Amazon ECS 마이크로서비스, 기타 다양한 서비스를 모니터링하는 약 38,000개의 Dynatrace OneAgent를 보유하고 있습니다. 이 규모에서 이전에는 서로 다른 영역에서 동일한 기능을 수행하는 여러 도구를 사용했는데, 이로 인해 문제 해결 과정에서 허점과 블랙 박스가 발생했습니다. Dynatrace가 포함된 AWS DevOps 에이전트는 이러한 상황을 완전히 바꿉니다. Dynatrace는 문제를 신속하고 정확하게 감지하고, 문제가 발생한 애플리케이션 계층을 찾아낸 다음, 에이전트가 추가 조사를 수행하여 문제 해결을 위한 정확한 단계를 제공합니다. 이 모든 내용이 Dynatrace에 직접 전달됩니다. 오전 3시에 인시던트 콜을 시작한 후 여러 도구를 전환할 필요 없이 이제 한 곳에서 해답을 찾을 수 있습니다.”

Jason Eckhart, United Airlines 신뢰성 및 관측성 담당 수석 엔지니어

Missing alt text value

T-Mobile

"AWS가 DevOps Agent를 도입한 초기부터 T-Mobile이 관여했습니다." 설계 파트너로서 AWS DevOps 에이전트가 어떻게 프로덕션 환경 전반의 근본 원인 분석을 크게 개선할 수 있는지 확인했습니다. 실제 피드백은 제품의 발전에 직접적인 영향을 미쳤습니다. 

우리 인프라는 여러 클라우드와 온프레미스 환경에 걸쳐 있으며, 애플리케이션 로그는 온프레미스 Splunk 배포 환경에 중앙 집중식으로 처리됩니다. Splunk와 원활하게 통합되어 다양한 환경에서 로그를 분석할 수 있는 AWS DevOps 에이전트 기능은 솔루션 파일럿을 계속 진행하는 데 큰 영향을 미쳤습니다."

Aravind Manchireddy, T-Mobile 기술 운영 담당 수석 부사장

Missing alt text value

Western Governors University

19만 1천 명 이상의 학생에게 서비스를 제공하는 선도적인 온라인 대학 웨스턴 거버너스 대학교(WGU)는 re:Invent를 통해 사전 공개되기 전부터 Amazon DevOps 에이전트를 프로덕션 환경에 배포한 최초의 기관 중 한 곳입니다. 대규모 Dynatrace 사용자인 WGU는 DevOps 에이전트의 기본 Dynatrace 통합을 활용하므로 Dynatrace Intelligence가 조사를 위해 문제 기록을 에이전트에 자동으로 라우팅하고 풍부한 결과를 Dynatrace에 직접 반환할 수 있습니다.

최근 프로덕션 조사에서 WGU의 SRE 팀은 DevOps 에이전트를 통해 서비스 중단 시나리오를 분석했고 2시간으로 예상했던 총 해결 시간을 단 28분으로 단축하여 MTTR을 77% 개선했습니다. 이 에이전트는 Lambda 함수 구성 내에서 근본 원인을 신속하게 찾아내 이전에는 찾아내지 못했던, 내부 문서에만 존재했던 중요한 운영 지식을 밝혀냈습니다.

"결정적인 증거를 제시할 수 있었고, Lambda가 원인임을 밝혀냈습니다." 조사 결과 프런트 엔드에서 본 것과 거의 일치하는 완벽한 지표가 있었습니다.” 그리고 이렇게 덧붙였습니다. “어제 엄청난 쾌거를 거두었습니다. 계속해서 발견을 가속화할 수 있다면 우리 조직이 얼마나 크게 성공할지 상상할 수 없습니다.” WGU는 DevOps 에이전트 스킬 기능을 활용할 계획이며, 이로써 조사 시간을 더욱 단축할 수 있을 것으로 기대합니다.

Angel Marchena, 웨스턴 거버너스 대학교 기술 운영 책임자

Missing alt text value

Zenchef

Zenchef는 레스토랑이 예약, 테이블 운영, 디지털 메뉴, 결제, 고객 마케팅을 수수료 없는 단일 시스템에서 관리할 수 있도록 지원하는 레스토랑 기술 플랫폼입니다. 여러 사업부에 걸쳐 다양한 프로덕션 환경을 관리하는 데 집중하는 DevOps 팀은 회사 해커톤 기간 동안 다운스트림 파트너에게 영향을 미치는 API 통합 문제가 발생했을 때 진정한 시험대에 올랐습니다. 엔지니어들이 이벤트에 참여한 가운데, 모니터링 시스템에서 문제 해결 방향을 제시할 만한 중요한 단서가 전혀 나타나지 않았습니다.

팀은 엔지니어를 해커톤에서 배제하는 대신 DevOps 에이전트에게 이 문제를 제시했습니다. 그러자, 체계적인 방식으로 문제를 해결해 나갔으며, 인증 문제를 원인에서 제외하고 ECS 배포로 조사 초점을 옮긴 후, 최종적으로 새 버전에서 데이터베이스의 인식되지 않는 열거형 값을 처리하지 못하는 코드 회귀 오류가 근본 원인임을 밝혀냈습니다. 전체 조사는 20~30분 만에 완료되었습니다. 1~2시간이 걸렸던 수작업에 비해 약 75% 줄어든 수치이며, 조사 결과는 담당 엔지니어와 직접 공유했습니다.

“해커톤 중에는 조사할 수 있는 대역폭이 거의 없었으며 그럴 필요도 없었습니다. 항상 몇 수 앞서려 노력하고 있으며, 이러한 선제적 조사는 이 방법이 아니었다면 불가능했을 수도 있습니다. DevOps 에이전트는 플랫폼의 작동 방식을 이해하는 새로운 방법을 제공합니다.”

Theo Massard, Zenchef 플랫폼 엔지니어링 관리자

Missing alt text value

사용 사례

인시던트 대응 및 해결

AWS DevOps 에이전트는 인시던트를 자율적으로 분류하고 팀이 신속하게 해결하도록 안내합니다. AWS DevOps 에이전트는 관찰성 도구, 코드 리포지토리 및 CI/CD 파이프라인과 통합되어 원격 분석, 코드 및 배포 데이터를 상호 연관시키고 분석하며 가설, 관찰 및 결과를 공유합니다. AWS DevOps 에이전트는 체계적인 조사를 통해 전체 환경에서 시스템 변경, 입력 이상, 리소스 제한, 구성 요소 장애 및 종속성 문제로 인한 문제의 근본 원인을 식별합니다.

자동화된 인시던트 조정

대화형 채팅을 사용하여 조사를 시작하고 안내할 수 있습니다. AWS DevOps 에이전트는 운영 팀의 일원으로 ServiceNow 및 Slack과 같은 협업 도구 내에서 직접 작업하여 조사 결과를 공유하고 대응을 조정합니다. 필요한 경우 조사를 통해 직접 AWS Support 사례를 생성하여 AWS Support 전문가에게 즉각적인 컨텍스트를 제공하여 보다 빠르게 해결할 수 있습니다.

향후 운영 인시던트 방지

AWS DevOps 에이전트는 과거 인시던트 패턴을 분석하여 관찰성, 인프라 최적화, 배포 파이프라인 개선, 애플리케이션 복원력이라는 네 가지 주요 영역을 강화하는 실행 가능 권장 사항을 제공합니다. 

온디맨드 SRE 태스크 처리 가속화

콘솔을 탐색하지 않고도 운영 질문에 대한 상황에 맞는 답변을 즉시 얻습니다. 자연스러운 대화를 통해 리소스 상태를 쿼리하고, 사고 패턴을 조사하고, 배포를 추적하고, 권장 사항을 탐색합니다. Q&A 외에도 일일 운영 상태 요약 또는 4xx 오류 추세와 같은 사용자 지정 차트와 보고서를 생성, 저장 및 공유합니다. 대화 기록이 유지되므로 컨텍스트를 잃지 않고 이전 쿼리를 기반으로 구축합니다.

오늘 원하는 내용을 찾으셨나요?

페이지의 콘텐츠 품질을 개선할 수 있도록 피드백을 보내주세요.