1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 在一个 Slurm 集群联盟中启用通信,你需要使用相同的 Munge 密钥。
对于每个新的集群,ParallelCluster 会生成一个随机密钥供 Munge 使用,因此你需要在两个集群中使用相同的密钥。
你可以从第一个集群中获取密钥,它位于 /etc/munge/munge.key
文件中,然后以正确的权限在另一个集群中复制它。
复制 Munge 密钥后,你需要重启 head 节点中的守护进程(包括 munged 和 slurmctld)。
相关内容
- AWS 官方已更新 1 年前
- AWS 官方已更新 2 年前
- AWS 官方已更新 1 年前
- AWS 官方已更新 2 年前