无法使用基于先前运行集群实例创建的AMI还原ParallelCluster集群

0

【以下的问题经过翻译处理】 我正在建立一个类似于https://aws.amazon.com/blogs/compute/running-ansys-fluent-on-amazon-ec2-c5n-with-elastic-fabric-adapter-efa/描述的群集。

在第一次尝试中,我安装了libreoffice并添加了一些变化来创建一个AMI环境。我在配置文件的群集部分添加了一个custom_ami标签,成功恢复了环境。得到的环境具有预期的差异。

在第二次尝试中,我进行了大量设置的修改,包括:

  • 添加了一个ebs部分,并指定了加密
  • 安装某些第三方软件包,包括conda和MATLAB
  • 指定一个cronjob在重新启动时初始化nicedcv会话

当我创建这个环境的AMI并告诉pcluster使用它时,生成的实例未通过状态检查,无法访问。

有没有不兼容AMI恢复的某些功能?是否需要额外的步骤来创建与pcluster兼容的AMI?

profile picture
专家
已提问 5 个月前5 查看次数
1 回答
0

【以下的回答经过翻译处理】 你好,David,

我知道你想通过使用另一个正在运行的集群的主节点的AMI作为custom_ami来创建一个新的集群,但如果我有什么误解,请纠正我。

如果是这样,我必须确认它是行不通的。你不能将一个正在运行的实例的AMI作为新集群的基础AMI重复使用。

原因是,在实例引导期间,ParallelCluster执行配置动作,这取决于它是集群的主节点还是计算节点。

通过使用主节点AMI,你正在尝试在已经执行了配置步骤的新集群上创建一个新集群,因此这个AMI不能正常工作,也不能用作计算节点。

如果你使用“修改AWS ParallelCluster AMI”的方法,你应该始终从这个列表中的AMI开始:https://github.com/aws/aws-parallelcluster/blob/v2.10.0/amis.txt

在此处查看更多详细信息:https://docs.aws.amazon.com/parallelcluster/latest/ug/tutorials_02_ami_customization.html#modify-an-aws-parallelcluster-ami

如果有所帮助,请让我们知道。

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则