AWS Batch EC2で1GPUのインスタンスに複数のコンテナを起動し複数のコンテナが1GPUを共用したい

0

AWS Batch EC2ではジョブ定義でGPU数を指定することでコンテナにNvidia Runtimeが指定されてインスタンスのGPUが使用できるようです。

しかし、この場合単一のGPUに対して複数のコンテナを起動するのことができません。

ジョブ定義でGPU数を1に設定したジョブが2つ実行された場合、オートスケーリンググループは2つのインスタンスを起動し、それぞれのインスタンスでコンテナを起動します。私は1つのインスタンス上に2つのコンテナを起動し、1つのGPUを2つのコンテナから使いたいです。

どのように設定すれば上記のようなことが可能でしょうか?

asked 3 months ago325 views
1 Answer
0
Accepted Answer

以下のissueはECSのものですが、AWS Batchでも同じような方法で解決できるかもしれません。
「default-runtime」を「nvidia」にすると使えるようになるようです。(ただし、AWS公式の回答ではないので本当に動くのかや最適な方法なのかといった部分は不明です)
https://github.com/aws/containers-roadmap/issues/327#issuecomment-471162879

カスタムAMIの作成はこちらが参考になると思います。
https://dev.classmethod.jp/articles/dlami-for-ecs/

profile picture
EXPERT
answered 3 months ago

You are not logged in. Log in to post an answer.

A good answer clearly answers the question and provides constructive feedback and encourages professional growth in the question asker.

Guidelines for Answering Questions