Управляемые инстансы Amazon ECS теперь поддерживают метрики графических процессоров NVIDIA
Amazon Elastic Container Service (Amazon ECS) теперь предлагает метрики NVIDIA GPU для контейнерных рабочих нагрузок, работающих на управляемых инстансах Amazon ECS. Эти метрики доступны в Аналитике контейнеров Amazon CloudWatch с расширенными возможностями наблюдения, что позволяет клиентам отслеживать состояние и производительность графических процессоров для устранения неполадок и оптимизации рабочих нагрузок с ускорением на GPU в Amazon ECS.
Благодаря новым метрикам графических процессоров клиенты управляемых инстансов Amazon ECS теперь могут отслеживать емкость, загрузку, память, состояние оборудования и температурные условия графического процессора непосредственно в CloudWatch. Используя Аналитику контейнеров с расширенными возможностями наблюдения, клиенты получают детализированное представление об этих метриках, в том числе на уровне графических процессоров. Эти метрики позволяют клиентам отслеживать рабочее и аппаратное состояние графических процессоров в своем парке управляемых инстансов Amazon ECS, что помогает правильно выбирать емкость GPU, устранять проблемы с производительностью и выявлять неполадки до того, как они повлияют на рабочие нагрузки с ускорением на GPU (например, обучение и вывод ИИ и машинного обучения).
Метрики NVIDIA GPU для управляемых инстансов Amazon ECS доступны в Аналитике контейнеров во всех коммерческих регионах AWS. Чтобы начать работу, включите Аналитику контейнеров с расширенными возможностями наблюдения в кластере Amazon ECS и запустите типы инстансов Amazon EC2 с ускорением на GPU через поставщика ресурсов управляемых инстансов Amazon ECS. Информацию о стоимости Аналитики контейнеров см. на странице цен на Amazon CloudWatch. Дополнительные сведения см. в руководстве пользователя по метрикам расширенного наблюдения в Аналитике контейнеров Amazon ECS.