AWS Batch EC2で1GPUのインスタンスに複数のコンテナを起動し複数のコンテナが1GPUを共用したい

0

AWS Batch EC2ではジョブ定義でGPU数を指定することでコンテナにNvidia Runtimeが指定されてインスタンスのGPUが使用できるようです。

しかし、この場合単一のGPUに対して複数のコンテナを起動するのことができません。

ジョブ定義でGPU数を1に設定したジョブが2つ実行された場合、オートスケーリンググループは2つのインスタンスを起動し、それぞれのインスタンスでコンテナを起動します。私は1つのインスタンス上に2つのコンテナを起動し、1つのGPUを2つのコンテナから使いたいです。

どのように設定すれば上記のようなことが可能でしょうか?

已提问 3 个月前325 查看次数
1 回答
0
已接受的回答

以下のissueはECSのものですが、AWS Batchでも同じような方法で解決できるかもしれません。
「default-runtime」を「nvidia」にすると使えるようになるようです。(ただし、AWS公式の回答ではないので本当に動くのかや最適な方法なのかといった部分は不明です)
https://github.com/aws/containers-roadmap/issues/327#issuecomment-471162879

カスタムAMIの作成はこちらが参考になると思います。
https://dev.classmethod.jp/articles/dlami-for-ecs/

profile picture
专家
已回答 3 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则