Warum zeigt CloudWatch an, dass die CPU- oder GPU-Auslastung meines Amazon SageMaker-Endpoints über 100% liegt?

Lesedauer: 2 Minute
0

Die Amazon CloudWatch-Metrik zur CPU- oder GPU-Auslastung für meinen Amazon SageMaker-Endpunkt beträgt mehr als 100%.

Lösung

Die CloudWatch-Metriken CPUUtilization und GPUUtilization zeigen den Prozentsatz der CPU- oder GPU-Einheiten, die die Container verwenden. Der Wert wird mit der Anzahl der CPUs oder GPUs multipliziert, weshalb der Wert größer als 100% sein kann.

Hier sind einige Beispiele:

  • Bei einer Nicht-GPU-Instance wie ml.m4.xlarge kann die CPUUtilization zwischen 0 und 400 % liegen, da die Instance über vier vCPUs verfügt.
  • Für eine GPU-Instance wie ml.p3.8xlarge kann die CPUUilization zwischen 0 und 3200 % liegen. Die GPUUtilization kann zwischen 0 und 400 % liegen. Dies liegt daran, dass die Instance über 32 vCPUs und 4 GPUs verfügt.
  • Für mehrere Instanceen zeigt die Standardansicht in CloudWatch die durchschnittliche CPU- oder GPU-Auslastung aller Instances. Wenn Sie beispielsweise fünf ml.m4.xlarge Instances haben, kann die CPUUtilization zwischen 0 und 400 % liegen, da jede Instance über vier vCPUs verfügt.

Weitere Informationen zu den Metriken CPUUtilization und GPUUtilization finden Sie unter Überwachen von Amazon SageMaker mit Amazon CloudWatch. Eine Liste der Anzahl der vCPUs oder GPUs in jedem Instance-Typ finden Sie unter Amazon SageMaker-Preise.


AWS OFFICIAL
AWS OFFICIALAktualisiert vor 2 Jahren