AWS 기술 블로그

VPC 트래픽 미러링 및 Gateway Load Balancer를 사용하여 NETSCOUT APM으로 엔드-투-엔드 가시성 구축

이 글은 AWS Partner Network(APN) Blog에 게시된 Building End-to-End Visibility with NETSCOUT APM Using Traffic Mirroring and Gateway Load Balancer by Jay Hong and Byungho Lee 한국어 번역 및 편집하였습니다.

NETSCOUT는 네트워킹, 보안, 마이그레이션 및 현대화 역량을 갖춘 AWS 전문화 파트너이자 AWS 마켓플레이스 판매자입니다. NETSCOUT는 온프레미스 및 클라우드 환경에 대해, 일관된 고해상도 실시간 가시성을 제공하는 서비스 보증, 보안 및 비즈니스 분석 솔루션을 제공하는 선도 공급업체입니다.

NETSCOUT APM(Application Performance Management) 솔루션은 하이브리드 클라우드 환경에서 애플리케이션 워크로드와 컴퓨팅, 네트워크 및 스토리지 인프라 종속성에 대한 종합적인 가시성을 제공합니다.

또한 NETSCOUT nGeniusONE 서비스 보증 플랫폼은 데이터, 음성 및 비디오 서비스 제공 성능 특성에 관한 통찰력을 제공하여 가용성 및 사용자 경험 품질을 관리하는 데 도움이 됩니다. 네트워크 구성요소, 애플리케이션 및 디바이스 전반 서비스 가시성을 위한 공통 메타데이터 세트를 제공하여 네트워크 및 IT 운영 팀 요구 사항을 해결함으로써 네트워크 및 애플리케이션 성능 문제를 해결하는 데 필요한 시간을 단축합니다.

이번 게시물에서는 서비스 성능 관리를 위한 가시성에 대해 살펴보겠습니다. 또한 VPC 트래픽 미러링과 AWS Gateway Load Balancer(GWLB)를 사용하여 NETSCOUT APM 기반 총체적 접근 방식으로 서비스 성능 관리 및 보안 관리 가시성을 구현하는 방법도 설명합니다.

가시성이란 무엇입니까?

가시성은 네트워크에서 발생하는 서비스 흐름과 사용량 및 네트워크에서 실행되는 애플리케이션에 대한 상세한 통찰력을 제공합니다. 이를 통해 사용자는 다른 방법으로 감지하기 어려운 성능 저하를 식별하고 관리할 수 있습니다.

클라우드는 끊임없이 진화하고 있으며, 기업은 클라우드 환경에서 분산 서비스 성능과 확장성을 최적화하는 데 중점을 두고 있습니다. 또한 여러 AWS 계정과 데이터 센터 환경을 관리하는 복잡성을 피할 수 없습니다.

네트워크 및 애플리케이션 서비스를 운영하고 문제를 해결하는 시간을 줄이고 복잡성을 단순화하는 통찰력을 얻으려면 이러한 환경에 대한 가시성이 필수적입니다.

NetOps 팀은 하이브리드 클라우드 환경 어느 곳에서나 애플리케이션에 액세스하는 모든 사용자를 위한 지속적인 가용성과 성능을 필요로 합니다.

NETSCOUT APM은 다음과 같은 상황에 대한 솔루션을 제공합니다.

  • 하이브리드 환경에서 MTTR(Mean-Time-to-Repair)을 단축하기 위한 문제 해결
  • 클라우드 마이그레이션 전/후 애플리케이션 종속성 평가
  • 연계된 애플리케이션 가용성과 성능 모니터링
  • 위치에 상관없이 임직원 디지털 경험을 모니터링하여 생산성 향상

보이지 않는 것은 관리할 수 없습니다.

앞서 클라우드 가시성 중요성에 대해 논의했습니다. 이제 클라우드 가시성에 필요한 것이 무엇인지 살펴보고 몇 가지 과제를 살펴보겠습니다.

네트워크 기반 가시성을 위해서는 트래픽을 수집할 방법이 필요하지만 모든 Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스에 에이전트를 설치하는 것이 트래픽 데이터를 수집하는 최선의 방법은 아닙니다. 이 접근 방식에는 몇 가지 문제가 있습니다.

  • 다수 인스턴스에 에이전트를 설치하고 유지 관리하는 데 드는 비용 관리
  • 에이전트가 인스턴스에 미치는 성능 영향 고려
  • 개별 네트워크 리소스(예: VPC, ENI(Elastic Network Interface) 및 서브넷) 에서 트래픽 수집 설정

NETSCOUT와 AWS를 활용한 통합 솔루션은 모든 Amazon EC2 인스턴스에 에이전트를 설치하지 않고도VPC 및 서브넷과 같은 다양한 데이터 소스에서 트래픽을 수집할 수 있는 비용 효율적인 방법을 제공합니다.

NETSCOUT를 활용하여 다중 VPC 환경에서 가시성을 높이기 위해 VPC 트래픽 미러링과 AWS Gateway Load Balancer를 사용할 수 있습니다. 두 가지 기술을 결합하여 네트워크 트래픽을 포괄적으로 파악할 수 있으며, 이를 통해 에이전트가 필요 없는 모니터링 환경에서 성능과 보안을 개선할 수 있습니다.

NETSCOUT는 네트워크 트래픽 데이터(패킷)를 수집하여 성능 관리를 위한 핵심 성능 지표(KPI)와 위협 사냥(Threat Hunting)을 위한 위협 지표를 생성합니다. 이를 통해 보안 위협을 탐지, 분석하고 서비스 성능에 대한 통찰력을 얻을 수 있습니다.

NETSCOUT는 클라우드 애플리케이션 및 네트워크 서비스를 위한 단일 창을 제공하며, 통합 데이터 소스를 통해 다양한 서비스 관리 및 위협 사냥 기능을 지원합니다.

Omnis Cyber Intelligence: nGeniusONE APM과 통합

Omnis Cyber Intelligence(OCI)는 nGeniusOne과 통합되어 보안 위협과 서비스 성능을 한 눈에 볼 수 있는 네트워크 탐지 및 대응(NDR) 솔루션입니다. 이를 통해 보안 위협과 성능 문제를 한 곳에서 파악할 수 있어 이를 쉽게 식별하고 해결할 수 있습니다.

OCI는 NETSCOUT 자체 위협 인텔리전스 플랫폼(Horizon) 을 비롯한 다양한 소스의 위협 인텔리전스를 통합하여 위협 환경을 보다 완벽하게 파악할 수 있도록 합니다. 따라서 모든 최신 위협을 탐지하고 이에 대응할 수 있다는 확신을 가질 수 있습니다.

  • 악성 트래픽 식별: OCI는 DDoS(분산 서비스 거부) 공격 또는 멀웨어 다운로드와 같은 악성 트래픽을 식별하는 데 사용될 수 있습니다.
  • 취약한 호스트 탐지: OCI는 공격에 취약한 호스트를 식별하는 데 사용할 수 있습니다.
  • 위협 인텔리전스 제공: OCI는 보안 태세를 개선하는 데 사용할 수 있는 위협 인텔리전스를 제공합니다.

또한 NETSCOUT 솔루션은 네트워크 트래픽에 대한 포괄적인 가시성과 통찰력을 제공하여 조직이 보안 위협을 식별하고 완화하는 데 도움이 됩니다. NETSCOUT는 AWS Security Hub와 통합될 수 있으며, 이를 통해 조직은 여러 소스의 보안 데이터를 단일 뷰로 통합할 수 있습니다. 이러한 통합 솔루션은 자동화된 위협 탐지 및 대응 기능을 제공합니다.

실제로 엔터프라이즈 IT 조직은 NETSCOUT 솔루션으로 가능해진 실행 가능한 인텔리전스를 활용하여 서비스 성능을 보호하고 최적화함으로써 동시에 AWS 환경을 최대한 활용할 수 있도록 합니다.

그림 1 – AWS와 통합된 NETSCOUT 보안 및 성능 가시성

솔루션 배포 아키텍처

다중 계정 또는 다중 VPC 검사 아키텍처에서 중앙 집중식 모니터링 기능을 사용하려면 GWLB 엔드포인트(GWLBE)를 VPC 트래픽 미러링 대상으로 사용합니다.

이 기능을 사용하면 고객은 VPC 피어링 또는 AWS Transit Gateway를 별도로 사용하여 연결하지 않고 스포크 VPC(Spoke VPC) ENI에서 중앙 집중식 VPC 내 위치한 모니터링 어플라이언스로 트래픽을 미러링할 수 있습니다.

또한 검사 VPC, 스포크 VPC 및 온프레미스 트래픽을 통합하여 엔드-투-엔드 가시성을 구축할 수 있습니다.

그림 2 – 중앙 집중식 트래픽 모니터링 아키텍처

위 그림 2 다중 계정 환경에서 NETSCOUT 어플라이언스를 사용한 중앙 집중식 모니터링 아키텍처입니다. 위 아키텍처에서는 GENEVE(RFC 8926) 헤더와 VXLAN(RFC 7348) 헤더를 사용하여 캡슐화된 여러 패킷을 디코딩하여 NETSCOUT의 관찰가능성을 확인할 수 있습니다.

프로덕션 계정에서는 엣지 VPC GWLB 엔드포인트로 라우팅하여 수신/송신 트래픽을 제어합니다. 이 GWLB 엔드포인트는 인터넷 게이트웨이와 퍼블릭 리소스 간 검사 지점이 되며, 보안 계정 검사 VPC에 있는 GWLB용 엔드포인트 서비스에 연결됩니다.

일반적으로 보안 계정에서는 GWLB 뒤에 스테이트풀 어플라이언스를 배포하여 North-South(인터넷 송수신) 및 East-West(VPC 간) 트래픽을 검사합니다. 각 어플라이언스ENI 수준에서 트래픽 미러링을 활성화하면 모니터링 VPC GWLB용 엔드포인트 서비스에 연결된 다른 GWLB 엔드포인트로 트래픽을 미러링할 수 있습니다. (트래픽 미러링 할당량 및 제한을 사전에 고려해야 합니다.)

국내 한 디지털 서비스 회사는 데이터 센터와 AWS 환경에서 nGeniusOne APM을 사용하여North-South 트래픽과 타사 애플리케이션을 포함한 애플리케이션 서버 환경 내 East-West 트래픽을 모두 모니터링합니다. nGeniusOne은 대시보드부터 세션 분석 및 서비스 종속성에 이르는 논리적 워크플로를 활용하여 문제의 실제 원인을 신속하게 파악합니다.

NETSCOUT 솔루션을 전체적으로 구현하면 NetOps 및 애플리케이션 팀이 네트워크 성능을 비롯해, 비즈니스 요구 사항에 필요한 고품질 애플리케이션 성능과 최종 사용자 경험을 유지할 수 있습니다.

하이브리드 아키텍처의 경우, NETSCOUT APM은 트랜잭션 서비스 흐름을 기반으로 애플리케이션 서비스 구성, 성능, 오류 및 사용에 대한 통합 분석을 제공하는 단일 창을 구성했습니다. 이를 통해 고객은 최종 사용자 트랜잭션과 클라우드, 데이터 센터 및 외부 애플리케이션 서비스 간 상관 관계를 분석하여 오류를 신속하게 감지하고 해결할 수 있습니다.

그림 3 – NETSCOUT APM을 사용한 하이브리드 클라우드 성능 관리

이 솔루션을 사용하면 GWLB 엔드포인트를 사용하여 프라이빗 연결이 가능한 모든 계정 또는 VPC에서 모니터링 어플라이언스로 미러링된 트래픽을 중앙 집중화할 수 있습니다. GWLB는 어플라이언스의 배포, 확장성, 가용성을 관리하므로 사용자는 네트워크 관리자, 시스템 운영자 및 NetSecOps 엔지니어에게 어플라이언스 관리보다 네트워크 관찰가능성에 집중할 수 있게 합니다.

위 그림 3에서는 다양한 네트워크 세그먼트에서 트래픽 데이터를 수집하고 TCP(Transmission Control Protocol) 세션을 분석하여 최종 사용자 애플리케이션 사용을 추적하는 것을 볼 수 있습니다. 특정 네트워크 세그먼트 문제를 쉽게 식별하고 웹 그래픽 사용자 인터페이스(GUI)를 통해 상세한 분석 기능을 제공합니다.

그림 4 – 여러 네트워크 세그먼트를 사용한 하이브리드 클라우드 모니터링

이 분석 기능은 궁극적으로 다중 VPC 또는 하이브리드 클라우드 환경에서 분석 및 가시성을 위한 기반을 제공합니다. 위 그림 4에서 NETSCOUT가 국내 디지털 서비스 회사의 여러 네트워크 세그먼트에 대한 가시성 및 문제 분석 솔루션을 제공한 방법을 확인할 수 있습니다.

그림 5 – AWS 트래픽 모니터링 및 분석

위 그림 5는 VPC 트래픽 미러링 및 GWLB를 사용하여 트래픽 데이터를 수집하고 가시화한 NETSCOUT nGeniusOne 분석 화면 입니다. 이 화면을 통해 GWLB 및 VxLAN 패킷의 디코딩된 결과를 확인할 수 있고, 정확한 트래픽 가시성 및 분석 솔루션 구축을 지원합니다.

NETSCOUT 모니터링 가시성을 통해 사용자는 여러 GWLB 및 VPC 트래픽 미러링을 통과한 트래픽을 포함하여 여러 VPC 트래픽을 동시에 분석할 수 있습니다.

그림 6 – VxLAN 디코딩을 사용한 네트워크 모니터링

AWS 캡슐화 데이터를 분석하면 네트워크 세그먼트, 애플리케이션, 트랜잭션 및 최종 사용자에 대한 통찰력을 얻을 수 있습니다.

그림 6은 VxLAN 및 GENEVE와 같은 캡슐화된 트래픽의 정확한 역캡슐화가 필요한 각 네트워크 세그먼트 성능 및 사용량 모니터링을 보여줍니다. 대시보드를 통해 네트워크 및 애플리케이션 성능, 사용량, 문제에 대한 포괄적인 가시성을 제공하려면 이 방법을 사용해야 합니다.

결론

서비스와 애플리케이션을 클라우드로 마이그레이션하는 IT 조직은 마이그레이션 전, 도중, 후에 대한 가시성이 필요합니다.

NETSCOUT nGenius Enterprise Performance Management를 사용하면 조직은 프로세스 전반에 걸쳐 모든 애플리케이션 및 서비스 종속성과 성능 문제를 이해할 수 있으므로 성공적인 마이그레이션과 성능 수준을 유지할 수 있습니다.

NETSCOUT는 트래픽 데이터를 NETSCOUT 스마트 데이터로 전환하여 고객이 수익에 영향을 미치기 전에 문제를 해결할 수 있도록 지원합니다. 이는 AWS Gateway Load Balancer 엔드포인트와 같은 클라우드 네이티브 서비스를 VPC 트래픽 미러링 대상으로 사용하여 NETSCOUT 모니터링 솔루션에서 수행됩니다.

AWS 마켓플레이스에서 NETSCOUT에 대해 자세히 알아볼 수 있습니다.

이름

Jay Hong

NETSCOUT 홍정표 상무는 다수의 고객사에 다양한 시스템에 대한 구축과 컨설팅을 수행하였으며, 특히 네트워크 및 애플리케이션 가시성과 모니터링에서 분석, 운영 등의 업무 수행과 보안 인프라 구성과 분석, 보안 가시성 컨설팅으로 고객사 환경의 안정적이고 최적화된 운영을 위하여 활동하고 있습니다.

Byungho Lee

Byungho Lee

이병호 솔루션즈 아키텍트는 네트워크 엔지니어링 분야 전문성을 갖고 엔터프라이즈 고객을 위해 일하고 있습니다. 복잡한 요구사항을 해결하기 위한 최적의 솔루션을 설계하고 지속적으로 클라우드 이니셔티브를 확대하고자 노력하고 있습니다.