Perché CloudWatch mostra che l'utilizzo della CPU o della GPU del mio endpoint Amazon SageMaker è superiore al 100%?

2 minuti di lettura
0

La metrica di utilizzo della CPU o della GPU di Amazon CloudWatch per il mio endpoint Amazon SageMaker è superiore al 100%.

Risoluzione

La metriche CPUUtilization e GPUUtilization di CloudWatch mostrano la percentuale di unità CPU o GPU utilizzate dai container. Il valore viene moltiplicato per il numero di CPU o GPU, motivo per cui il valore può essere superiore al 100%.

Ecco alcuni esempi:

  • Per un'istanza non GPU come ml.m4.xlarge, la metrica CPUUtilization può variare dallo 0 al 400% poiché l'istanza dispone di quattro vCPU.
  • Per un'istanza GPU come ml.p3.8xlarge, la metrica CPUUtilization può variare dallo 0 al 3200%. La metrica GPUUtilization può variare dallo 0 al 400%. Questo perché l'istanza dispone di 32 vCPU e 4 GPU.
  • Per più istanze, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio della CPU o della GPU in tutte le istanze. Ad esempio, se hai cinque istanze ml.m4.xlarge, la metrica CPUUtilization può variare dallo 0 al 400% perché ogni istanza ha quattro vCPU.

Per ulteriori informazioni sulle metriche CPUUtilization e GPUUtilization , consulta la pagina Monitor Amazon SageMaker with Amazon CloudWatch. Per visualizzare un elenco che indica quante vCPU o GPU ci sono in ogni tipo di istanza, consulta la pagina Prezzi di Amazon SageMaker.


AWS UFFICIALE
AWS UFFICIALEAggiornata 2 anni fa