Sagemaker ml.g5.2xlarge instances not working as desired due to nvidia-drivers issue

0

Over the weekend my sagemaker ml.g5.2xlarge started failing with the following errors: -> RuntimeError: No CUDA GPUs are available -> NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

wipwai
demandé il y a 2 mois292 vues
1 réponse

Vous n'êtes pas connecté. Se connecter pour publier une réponse.

Une bonne réponse répond clairement à la question, contient des commentaires constructifs et encourage le développement professionnel de la personne qui pose la question.

Instructions pour répondre aux questions