AWS Batch EC2で1GPUのインスタンスに複数のコンテナを起動し複数のコンテナが1GPUを共用したい

0

AWS Batch EC2ではジョブ定義でGPU数を指定することでコンテナにNvidia Runtimeが指定されてインスタンスのGPUが使用できるようです。

しかし、この場合単一のGPUに対して複数のコンテナを起動するのことができません。

ジョブ定義でGPU数を1に設定したジョブが2つ実行された場合、オートスケーリンググループは2つのインスタンスを起動し、それぞれのインスタンスでコンテナを起動します。私は1つのインスタンス上に2つのコンテナを起動し、1つのGPUを2つのコンテナから使いたいです。

どのように設定すれば上記のようなことが可能でしょうか?

質問済み 2ヶ月前306ビュー
1回答
0
承認された回答

以下のissueはECSのものですが、AWS Batchでも同じような方法で解決できるかもしれません。
「default-runtime」を「nvidia」にすると使えるようになるようです。(ただし、AWS公式の回答ではないので本当に動くのかや最適な方法なのかといった部分は不明です)
https://github.com/aws/containers-roadmap/issues/327#issuecomment-471162879

カスタムAMIの作成はこちらが参考になると思います。
https://dev.classmethod.jp/articles/dlami-for-ecs/

profile picture
エキスパート
回答済み 2ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン