¿Por qué muestra CloudWatch que la utilización de la CPU o la GPU de mi punto de conexión de Amazon SageMaker es superior al 100 %?

2 minutos de lectura
0

La métrica de utilización de CPU o GPU de Amazon CloudWatch para mi punto de conexión de Amazon SageMaker es superior al 100 %.

Resolución

Las métricas de CloudWatch CPUUtilization y GPUUtilization muestran el porcentaje de unidades de CPU o GPU que los contenedores están utilizando. El valor se multiplica por el número de CPU o GPU, por lo que el valor puede ser superior al 100 %.

Estos son algunos ejemplos:

  • Para una instancia que no sea de GPU, como ml.m4.xlarge, laCPUUtilization puede oscilar entre el 0 y el 400 % porque la instancia tiene cuatro vCPU.
  • Para una instancia de GPU como ml.p3.8xlarge, la CPUUtilization puede oscilar entre el 0 y el 3200 %. CPUUtilization puede oscilar entre el 0 y el 400 %. Esto se debe a que la instancia tiene 32 vCPU y 4 GPU.
  • Para varias instancias, la vista predeterminada de CloudWatch muestra el uso promedio de la CPU o la GPU en todas las instancias. Por ejemplo, si tiene cinco instancias de ml.m4.xlarge, la CPUUtilization puede oscilar entre el 0 y el 400 % porque cada instancia tiene cuatro vCPU.

Para obtener más información sobre las métricas de CPUUtilization y GPUUtilization consulte, Supervisar Amazon SageMaker con Amazon CloudWatch. Para obtener una lista del número de vCPU o GPU que hay en cada tipo de instancia, consulte los precios de Amazon SageMaker.


OFICIAL DE AWS
OFICIAL DE AWSActualizada hace 2 años