All Content tagged with AWS ParallelCluster

内容语言: 中文 (简体)

选择要筛选的标签
排序方式 最新
17 条结果
【以下的问题经过翻译处理】 问:是否有人在FSx中创建了OpenZFS卷并能够使用AWS ParallelCluster中的pcluster3 cli挂载该卷? 似乎不起作用。我创建了一个OpenZFS文件系统,但我无法从pcluster cli中挂载它。我在其他文件系统上没有这个问题。文件系统挂载的YAML描述符如下: ``` SharedStorage: - Name: modeling...
1
回答
0
点赞数
59
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我正在尝试按照此处的AWS Parallel Cluster上运行FDS/SMV的教程:<https://aws.amazon.com/blogs/compute/fire-dynamics-simulation-cfd-workflow-using-aws-parallelcluster-elastic-fabric-adapter-amazon-fsx-for-lu...
1
回答
0
点赞数
75
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 有没有办法在一个区域的多个可用区部署计算资源? 似乎我们只能为每个队列指定一个子网。 如果我尝试在不同的子网中设置队列,我会收到“所有队列使用的SubnetIds应该相同”的错误提示。 我明白延迟可能会受到影响,但如果工作负载不使用网络,那么获取更多的计算资源将是有利的!
1
回答
0
点赞数
14
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我正在尝试为使用AWS ParallelCluster 3创建的多个集群启用slurm计费,按照[此指南](https://aws.amazon.com/blogs/compute/enabling-job-accounting-for-hpc-with-aws-parallelcluster-and-amazon-rds/)。我已成功为第一个集群(`cluster-o...
1
回答
0
点赞数
42
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 你好, 我正在使用parallelcluster 3.5.1和slurm,在Frankfurt地区使用`c6i-large`,`c6i-xlarge`,`c6i-2xlarge`和`c6i-4xlarge`实例设置了带有4个队列的集群。队列是相同的,都已禁用HT。 我注意到使用1024个`c6i-4xlarge`实例的队列有时会表现出某种奇怪的行为-即使只有1个作业排队...
1
回答
0
点赞数
192
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 文档似乎说你可以使用t2.micro作为master_instance或compute_resource,仅供测试和玩耍。但是,当我尝试使用t3a.xlarge运行作业时,在/var/log/parallelcluster/slurm_resume日志中出现错误。计算节点无法启动: [slurm_plugin.common:add_instances_for_node...
1
回答
0
点赞数
38
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 当使用带有 c6g-medium 按需机器的分区运行并行集群时,其中 19 个在运行期间失败并且再也没有启动。 我的信息返回: ``` 分区可用时间限制节点状态节点列表 c6gm-ondemand up infinite 19 idle% c6gm-ondemand-dy-c6gmedium-[32-50] c6gm-ondemand up infinite ...
1
回答
0
点赞数
31
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我已经在alinux上使用awsbatch调度程序成功地运行了pcluster。现在我想在Master节点和Compute节点上都挂载EFS卷。我有很多自定义的本地库需要从运行的代码中引用,这些库会随着时间的推移而更新。输出数据也将写入EFS。 我已经使用post\_install配置在Master节点上使其工作。不幸的是,我刚刚注意到post\_install配置在...
1
回答
0
点赞数
41
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我的应用程序需要对所有存储设备进行加密。我有一个配置文件,其中指定了以下内容: \[cluster default] ... ebs_settings = custom \[ebs custom] encrypted = true 生成的实例有两个驱动器: /dev/sda1(未加密) /dev/sdb(加密) 根据这个主题:[https://foru...
1
回答
0
点赞数
16
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我正在尝试使用miniconda安装OpenMM和MD引擎,该引擎利用GPU。我的ParallelCluster配置如下: * Head节点:c5.2xlarge。 * 计算节点:g4dn.metal(T4 GPU)。 * 从EC2的网络化EFS存储。 我可以在head节点上使用miniconda安装OpenMM,但是当我运行测试以查看OpenMM是否有效时,出现以...
1
回答
0
点赞数
26
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 1. 我创建了一个有10个节点的并行集群,用它来运行一些东西。 2. 后来,我使用 `pcluster update-cluster` 命令增加了节点数。 3. 更新操作完成后,无论我使用什么命令(如 `pcluster list-clusters`),都显示 "cloudformationStackStatus": "UPDATE_COMPLETE" 和 "clust...
1
回答
0
点赞数
17
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我有一个应用程序,需要使用pcluster初始化一个主服务器,为我的同事们提供多个帐户用于登录。这个服务器必须不间断地运行(不能关闭以重新初始化为新镜像)。我每个同事的帐户都需要通过我们的调度程序(slurm)启动计算节点。我也不知道哪些同事需要帐户,所以需要在主节点初始化后添加或删除帐户。 我一直在测试pcluster创建的主节点,以尝试验证此功能。我的发现是,如果...
1
回答
0
点赞数
21
检视次数
profile picture
专家
已提问 1 年前
  • 1
  • 2
  • 12 条/页