如何判断我的笔记本实例是不是卡住了?

0

【以下的问题经过翻译处理】 我正在运行一个Sagemaker Notebook实例。如何判断我的Notebook是卡住了还是只是需要运行更长时间?我使用24xlarge在Athena中并行查询,但似乎在同一个查询上卡了很长时间。如何判断我是否需要更多的内存或更多的VCPUs?

profile picture
EXPERTE
gefragt vor 8 Monaten9 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 如果你的Sagemaker笔记本实例运行时间较长,你可以通过监控CPU和内存使用情况来检查它是否卡住或仍在运行。 如果CPU使用率低或为零,则可能卡住。

如果CPU使用率高但内存使用率低,则可能需要更多的VCPUs;如果内存使用率高,则可能需要更多的内存。 你可以通过SageMaker Notebook Instance终端检查它: 为了详细查看内存和CPU信息,请按照下面的指示操作: [1] 启动你的笔记本实例 [2] 进入Jupyter主页 [3] 右侧,点击下拉选项“New” [4] 选择“Terminal” 在Jupyter终端中,运行以下命令查看内存和CPU的信息。

[+] 查看内存信息:

$ free -h => “free-h”的输出将以人类可读的形式提供总内存、已用内存、空闲内存、共享内存等信息。 [+] 若要查看CPU信息,则可以运行以下任何一个命令: $ mpstat -u => “mpstat -u”的输出包含不同的字段,如%guest、%gnice、%steal等。 此外,您还可以检查cloudwatch日志中是否存在任何可能表明问题原因的错误或警告。大多数时候,cloudwatch有助于找出问题的根本原因。

您可以在CloudWatch下找到CloudWatch日志→ 日志组→ aws/sagemaker/NotebookInstances -> Notebook 名称

根据分析,您可以选择不同的笔记本实例类型。 如果您有任何困难或遇到任何问题,请联系AWS支持[+]([+] Creating support cases and case management - https://docs.aws.amazon.com/awssupport/latest/user/case-management.html#creating-a-support-casehttps://docs.aws.amazon.com/awssupport/latest/user/case-management.html#creating-a-support-case),并附上您的问题/用例的详细信息,我们很乐意为您提供进一步的帮助。

profile picture
EXPERTE
beantwortet vor 8 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen