Amazon CloudWatch Container Insights, 이제 Amazon EKS에서 Neuron UltraServers 지원

게시된 날짜: 2025년 11월 21일

Amazon CloudWatch Container Insights가 이제 Amazon EKS의 Neuron UltraServer를 지원하여, 다중 인스턴스 노드에서 대규모 고성능 기계 학습 워크로드를 실행하는 고객에게 향상된 관찰성을 제공합니다. 이 새로운 기능을 사용하면 데이터 사이언티스트와 기계 학습 엔지니어는 컨테이너화된 ML 애플리케이션을 효율적으로 모니터링하고 문제를 해결하여, Neuron UltraServer 그룹 전체에 집계된 지표와 간소화된 관리를 제공할 수 있습니다.

Neuron UltraServers는 여러 EC2 인스턴스를 단일 논리적 서버 유닛으로 결합하기 때문에, AWS Trainium 및 Inferentia 가속기를 사용하는 기계 학습 러닝 워크로드에 최적화되어 있습니다. Amazon CloudWatch의 모니터링 및 진단 기능인 Container Insights는 컨테이너화된 애플리케이션에서 지표를 자동으로 수집합니다. 이번 출시를 통해 Container Insights는 EKS 환경의 UltraServer를 위한 새로운 전용 필터를 도입하게 되었습니다. 이제 UltraServer ID를 선택하여 해당 서버 내 모든 인스턴스에 대한 새로운 집계 지표를 확인할 수 있으며, 따라서 개별 인스턴스를 따로 모니터링하지 않아도 됩니다. 사용자는 인스턴스별 지표는 물론 전체 UltraServer 그룹의 통합 성능 데이터도 확인할 수 있어, AWS Neuron에서 실행되는 기계 학습 워크로드 모니터링이 간소화됩니다.

Amazon CloudWatch Container Insights는 모든 상용 AWS 리전 및 AWS GovCloud(미국)에서 사용할 수 있습니다.

시작하려면 Amazon CloudWatch 사용 설명서의 AWS Trainium 및 AWS Inferentia용 AWS Neuron 지표를 참조하세요.