SageMaker training job is not stopping

0

Hi,

Greetings!!

I found some errors in cloud watch logs while executing a training job via SageMake pipelines but unfortunately training job did not fail. Hence I tried stopping a training job using boto3 APIs below and AWS CLI as well but training job is in stopping status for a long time and it's not stopping.

stop_pipeline_execution()

stop_training_job()

stop-training-job --training-job-name <value>

How to kill the training jobs forcefully?

Thanks

gefragt vor 2 Jahren772 Aufrufe
1 Antwort
0

Hello, did you notice any different error message on Cloudwatch after attempting to stop the training job ?

AWS
beantwortet vor 2 Jahren

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen