Sagemaker ml.g5.2xlarge instances not working as desired due to nvidia-drivers issue

0

Over the weekend my sagemaker ml.g5.2xlarge started failing with the following errors: -> RuntimeError: No CUDA GPUs are available -> NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

wipwai
posta 2 mesi fa292 visualizzazioni
1 Risposta

Accesso non effettuato. Accedi per postare una risposta.

Una buona risposta soddisfa chiaramente la domanda, fornisce un feedback costruttivo e incoraggia la crescita professionale del richiedente.

Linee guida per rispondere alle domande