如何判断我的笔记本实例是不是卡住了?

0

【以下的问题经过翻译处理】 我正在运行一个Sagemaker Notebook实例。如何判断我的Notebook是卡住了还是只是需要运行更长时间?我使用24xlarge在Athena中并行查询,但似乎在同一个查询上卡了很长时间。如何判断我是否需要更多的内存或更多的VCPUs?

profile picture
专家
已提问 8 个月前6 查看次数
1 回答
0

【以下的回答经过翻译处理】 如果你的Sagemaker笔记本实例运行时间较长,你可以通过监控CPU和内存使用情况来检查它是否卡住或仍在运行。 如果CPU使用率低或为零,则可能卡住。

如果CPU使用率高但内存使用率低,则可能需要更多的VCPUs;如果内存使用率高,则可能需要更多的内存。 你可以通过SageMaker Notebook Instance终端检查它: 为了详细查看内存和CPU信息,请按照下面的指示操作: [1] 启动你的笔记本实例 [2] 进入Jupyter主页 [3] 右侧,点击下拉选项“New” [4] 选择“Terminal” 在Jupyter终端中,运行以下命令查看内存和CPU的信息。

[+] 查看内存信息:

$ free -h => “free-h”的输出将以人类可读的形式提供总内存、已用内存、空闲内存、共享内存等信息。 [+] 若要查看CPU信息,则可以运行以下任何一个命令: $ mpstat -u => “mpstat -u”的输出包含不同的字段,如%guest、%gnice、%steal等。 此外,您还可以检查cloudwatch日志中是否存在任何可能表明问题原因的错误或警告。大多数时候,cloudwatch有助于找出问题的根本原因。

您可以在CloudWatch下找到CloudWatch日志→ 日志组→ aws/sagemaker/NotebookInstances -> Notebook 名称

根据分析,您可以选择不同的笔记本实例类型。 如果您有任何困难或遇到任何问题,请联系AWS支持[+]([+] Creating support cases and case management - https://docs.aws.amazon.com/awssupport/latest/user/case-management.html#creating-a-support-casehttps://docs.aws.amazon.com/awssupport/latest/user/case-management.html#creating-a-support-case),并附上您的问题/用例的详细信息,我们很乐意为您提供进一步的帮助。

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则