Sagemaker ml.g5.2xlarge instances not working as desired due to nvidia-drivers issue

0

Over the weekend my sagemaker ml.g5.2xlarge started failing with the following errors: -> RuntimeError: No CUDA GPUs are available -> NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

wipwai
質問済み 2ヶ月前292ビュー
1回答

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン

関連するコンテンツ