1 Risposta
- Più recenti
- Maggior numero di voti
- Maggior numero di commenti
0
You can use Neuron Monitor to monitor your Inf utilization. Neuron Monitor integrates with CloudWatch (see this documentation). One metric you can use to determine scaling is NeuronCore utilization. For example, you can average the number of NeuronCores with utilization that's higher than some threshold and scale up or down based on that.
con risposta 5 mesi fa
Contenuto pertinente
- AWS UFFICIALEAggiornata 3 anni fa
- AWS UFFICIALEAggiornata un anno fa
- AWS UFFICIALEAggiornata 2 anni fa