Аналитика контейнеров Amazon CloudWatch теперь поддерживает серверы Neuron UltraServer в Amazon EKS
Аналитика контейнеров Amazon CloudWatch теперь поддерживает серверы Neuron UltraServer в Amazon EKS, обеспечивая улучшенную наблюдаемость при выполнении крупномасштабных высокопроизводительных рабочих нагрузок машинного обучения на узлах с несколькими инстансами. Используя новые возможности, исследователи данных и ML-инженеры могут осуществлять эффективный мониторинг, поиск и устранение неполадок в контейнерных приложениях машинного обучения, благодаря доступу к агрегированным метрикам и упрощенному управлению группами Neuron UltraServer.
Серверы Neuron UltraServer объединяют несколько инстансов EC2 в один логический блок, оптимизированный для рабочих нагрузок машинного обучения, используя ускорители AWS Trainium и Inferentia. Аналитика контейнеров, функция мониторинга и диагностики в Amazon CloudWatch, автоматически собирает метрики из контейнерных приложений. Начиная с этого выпуска, Аналитика контейнеров поддерживает новый фильтр для серверов UltraServer в средах EKS. Теперь, выбрав идентификатор UltraServer, вы сможете просматривать новые агрегированные метрики по всем инстансам, находящимся на этом сервере, и вам больше не потребуется отдельно отслеживать каждый инстанс. Помимо метрик уровня инстанса, теперь можно просматривать консолидированные данные о производительности всей группы UltraServer, что делает более удобным мониторинг рабочих нагрузок машинного обучения, выполняемых на AWS Neuron.
Аналитика контейнеров Amazon CloudWatch доступна во всех коммерческих регионах AWS и регионах AWS GovCloud (США).
Для начала работы ознакомьтесь с метриками AWS Neuron для AWS Trainium и AWS Inferentia в руководстве пользователя Amazon CloudWatch.