当原始EBS快照丢失时如何更新Parallelcluster集群配置

0

【以下的问题经过翻译处理】 你好,

我使用ParallelCluster 2.10配置了一个集群,已经运行了半年多了。它有两个挂载了EBS资源的点:/shared和/install。似乎这两个挂载点关联的EBS快照都已经被删除。这应该不是问题,因为这些快照仅用于初始化集群。然而,现在我试图更新集群的配置——只是添加了一个计算节点(增加了max_queue_size),但是我遇到了以下错误信息:

<code>

(venv_aws) > pcluster update flacscloudHPC-2-10-0 -c ./config_flacscloudHPC

从CloudFormation中检索集群flacscloudHPC-2-10-0的配置...

验证配置文件./config_flacscloudHPC...

警告:配置参数“scheduler”生成了以下警告:

您正在使用的作业调度程序(torque)将在ParallelCluster的未来版本中被停用。更多信息请参见:https://github.com/aws/aws-parallelcluster/wiki/Deprecation-of-SGE-and-Torque-in-ParallelCluster

错误:部分 [ebs custom2] 的配置错误

快照snap-0870f8601759ca239似乎不存在:快照“snap-0870f8601759ca239”不存在。

</code>

在没有原始快照“snap-0870f8601759ca239”的情况下,我应该如何更新max_queue_size?强制使用一些已更新的现有快照重新配置集群是否安全?

profile picture
专家
已提问 5 个月前8 查看次数
1 回答
0

【以下的回答经过翻译处理】 你好,mfolusiak1,

为了执行更新,请确保集群配置中满足以下条件:

  1. 将“ebs_snapshot_id”设置为已删除快照的值
  2. 确保“volume_size”也已设置。如果没有,请添加并确保它反映了现有容量的大小
  3. 禁用健康检查,将“sanity_check”设置为“false”

完成上述步骤后,你可以使用“pcluster update”命令执行更新。

编辑者:luca-aws,于2021年9月7日上午5:40修改。

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则