Amazon CloudWatch Container Insights, Amazon EKS를 위한 1분 미만 GPU 지표 추가

게시된 날짜: 2025년 11월 21일

Amazon CloudWatch Container Insights가 이제 Amazon EKS에서 실행되는 AI 및 기계 학습 워크로드에 대해 1분 미만의 빈도로 GPU 지표를 수집하는 기능을 지원합니다. 고객은 몇 초 만에 지표 샘플링 속도를 구성하여 GPU 리소스 사용률을 보다 세밀하게 모니터링할 수 있습니다.

이 개선 사항을 사용하면 고객은 짧은 시간 동안 GPU 리소스를 소비하는 기계 학습 추론 같은, 60초 미만으로 실행되는 GPU 집약적 워크로드를 효과적으로 모니터링할 수 있습니다. 샘플링 빈도를 늘리면 고객은 수명이 짧은 GPU 워크로드에 대한 상세한 가시성을 유지할 수 있습니다. 1분 미만 GPU 지표는 1분마다 한 번씩 CloudWatch로 전송됩니다. 이렇게 세분화된 모니터링을 이용하면 고객은 GPU 리소스 활용도를 최적화하고, 성능 문제를 해결하고, 컨테이너화된 GPU 애플리케이션의 효율적인 운영을 보장할 수 있습니다.

Container Insights의 1분 미만 GPU 지표는 모든 AWS 상용 리전 및 AWS GovCloud(미국) 리전에서 사용할 수 있습니다.

Container Insights의 1분 미만 GPU 지표에 대해 자세히 알아보려면 Amazon CloudWatch 사용 설명서의 NVIDIA GPU 지표 페이지를 참조하세요. Container Insights의 1분 미만 GPU 지표는 추가 비용 없이 사용할 수 있습니다. Container Insights 요금 정보는 Amazon CloudWatch 요금 페이지에서 확인하세요.