Amazon CloudWatch Container Insights, 이제 Amazon EKS에서 Neuron UltraServers 지원
Amazon CloudWatch Container Insights가 이제 Amazon EKS의 Neuron UltraServer를 지원하여, 다중 인스턴스 노드에서 대규모 고성능 기계 학습 워크로드를 실행하는 고객에게 향상된 관찰성을 제공합니다. 이 새로운 기능을 사용하면 데이터 사이언티스트와 기계 학습 엔지니어는 컨테이너화된 ML 애플리케이션을 효율적으로 모니터링하고 문제를 해결하여, Neuron UltraServer 그룹 전체에 집계된 지표와 간소화된 관리를 제공할 수 있습니다.
Neuron UltraServers는 여러 EC2 인스턴스를 단일 논리적 서버 유닛으로 결합하기 때문에, AWS Trainium 및 Inferentia 가속기를 사용하는 기계 학습 러닝 워크로드에 최적화되어 있습니다. Amazon CloudWatch의 모니터링 및 진단 기능인 Container Insights는 컨테이너화된 애플리케이션에서 지표를 자동으로 수집합니다. 이번 출시를 통해 Container Insights는 EKS 환경의 UltraServer를 위한 새로운 전용 필터를 도입하게 되었습니다. 이제 UltraServer ID를 선택하여 해당 서버 내 모든 인스턴스에 대한 새로운 집계 지표를 확인할 수 있으며, 따라서 개별 인스턴스를 따로 모니터링하지 않아도 됩니다. 사용자는 인스턴스별 지표는 물론 전체 UltraServer 그룹의 통합 성능 데이터도 확인할 수 있어, AWS Neuron에서 실행되는 기계 학습 워크로드 모니터링이 간소화됩니다.
Amazon CloudWatch Container Insights는 모든 상용 AWS 리전 및 AWS GovCloud(미국)에서 사용할 수 있습니다.
시작하려면 Amazon CloudWatch 사용 설명서의 AWS Trainium 및 AWS Inferentia용 AWS Neuron 지표를 참조하세요.