Stay up to date with the latest from the Knowledge Center. See all new and updated Knowledge Center articles published in the last month and re:Post’s top contributors.
17 条结果
【以下的问题经过翻译处理】 问:是否有人在FSx中创建了OpenZFS卷并能够使用AWS ParallelCluster中的pcluster3 cli挂载该卷?
似乎不起作用。我创建了一个OpenZFS文件系统,但我无法从pcluster cli中挂载它。我在其他文件系统上没有这个问题。文件系统挂载的YAML描述符如下:
```
SharedStorage:
- Name: modeling...
【以下的问题经过翻译处理】 我正在尝试按照此处的AWS Parallel Cluster上运行FDS/SMV的教程:<https://aws.amazon.com/blogs/compute/fire-dynamics-simulation-cfd-workflow-using-aws-parallelcluster-elastic-fabric-adapter-amazon-fsx-for-lu...
【以下的问题经过翻译处理】 有没有办法在一个区域的多个可用区部署计算资源?
似乎我们只能为每个队列指定一个子网。
如果我尝试在不同的子网中设置队列,我会收到“所有队列使用的SubnetIds应该相同”的错误提示。
我明白延迟可能会受到影响,但如果工作负载不使用网络,那么获取更多的计算资源将是有利的!
【以下的问题经过翻译处理】 我正在尝试为使用AWS ParallelCluster 3创建的多个集群启用slurm计费,按照[此指南](https://aws.amazon.com/blogs/compute/enabling-job-accounting-for-hpc-with-aws-parallelcluster-and-amazon-rds/)。我已成功为第一个集群(`cluster-o...
【以下的问题经过翻译处理】 你好,
我正在使用parallelcluster 3.5.1和slurm,在Frankfurt地区使用`c6i-large`,`c6i-xlarge`,`c6i-2xlarge`和`c6i-4xlarge`实例设置了带有4个队列的集群。队列是相同的,都已禁用HT。
我注意到使用1024个`c6i-4xlarge`实例的队列有时会表现出某种奇怪的行为-即使只有1个作业排队...
【以下的问题经过翻译处理】 文档似乎说你可以使用t2.micro作为master_instance或compute_resource,仅供测试和玩耍。但是,当我尝试使用t3a.xlarge运行作业时,在/var/log/parallelcluster/slurm_resume日志中出现错误。计算节点无法启动:
[slurm_plugin.common:add_instances_for_node...
【以下的问题经过翻译处理】 当使用带有 c6g-medium 按需机器的分区运行并行集群时,其中 19 个在运行期间失败并且再也没有启动。
我的信息返回:
```
分区可用时间限制节点状态节点列表
c6gm-ondemand up infinite 19 idle% c6gm-ondemand-dy-c6gmedium-[32-50]
c6gm-ondemand up infinite ...
【以下的问题经过翻译处理】 我已经在alinux上使用awsbatch调度程序成功地运行了pcluster。现在我想在Master节点和Compute节点上都挂载EFS卷。我有很多自定义的本地库需要从运行的代码中引用,这些库会随着时间的推移而更新。输出数据也将写入EFS。
我已经使用post\_install配置在Master节点上使其工作。不幸的是,我刚刚注意到post\_install配置在...
【以下的问题经过翻译处理】 我的应用程序需要对所有存储设备进行加密。我有一个配置文件,其中指定了以下内容:
\[cluster default]
...
ebs_settings = custom
\[ebs custom]
encrypted = true
生成的实例有两个驱动器:
/dev/sda1(未加密)
/dev/sdb(加密)
根据这个主题:[https://foru...
【以下的问题经过翻译处理】 我正在尝试使用miniconda安装OpenMM和MD引擎,该引擎利用GPU。我的ParallelCluster配置如下:
* Head节点:c5.2xlarge。
* 计算节点:g4dn.metal(T4 GPU)。
* 从EC2的网络化EFS存储。
我可以在head节点上使用miniconda安装OpenMM,但是当我运行测试以查看OpenMM是否有效时,出现以...
【以下的问题经过翻译处理】 1. 我创建了一个有10个节点的并行集群,用它来运行一些东西。
2. 后来,我使用 `pcluster update-cluster` 命令增加了节点数。
3. 更新操作完成后,无论我使用什么命令(如 `pcluster list-clusters`),都显示 "cloudformationStackStatus": "UPDATE_COMPLETE" 和 "clust...
【以下的问题经过翻译处理】 我有一个应用程序,需要使用pcluster初始化一个主服务器,为我的同事们提供多个帐户用于登录。这个服务器必须不间断地运行(不能关闭以重新初始化为新镜像)。我每个同事的帐户都需要通过我们的调度程序(slurm)启动计算节点。我也不知道哪些同事需要帐户,所以需要在主节点初始化后添加或删除帐户。
我一直在测试pcluster创建的主节点,以尝试验证此功能。我的发现是,如果...