1回答
- 新しい順
- 投票が多い順
- コメントが多い順
0
You can use Neuron Monitor to monitor your Inf utilization. Neuron Monitor integrates with CloudWatch (see this documentation). One metric you can use to determine scaling is NeuronCore utilization. For example, you can average the number of NeuronCores with utilization that's higher than some threshold and scale up or down based on that.
回答済み 5ヶ月前
関連するコンテンツ
- AWS公式更新しました 2年前
- AWS公式更新しました 1年前
- AWS公式更新しました 2年前