1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 这与 CreateTrainingJob API 文档 一致,据我所知,这很难(不可调整的)限制。但是,如果您有强烈的要求,可能值得提出一个支持案例来仔细检查是否有可能增加?
您可以考虑通过 CloudWatch API / [boto3](https:/ /boto3.amazonaws.com/v1/documentation/api/latest/reference/services/cloudwatch.html)是否需要?我预计指标的可见位置会有一些限制(例如,在 SageMaker 控制台的训练作业详细信息页面上显示?在 SageMaker Studio 的实验和试验视图中显示?) - 但如果您能够将它们记录在它们可能会反映与自动收集的指标相同的“/aws/sagemaker/TrainingJobs/{TrainingJobName}”命名空间。您的脚本代码应该能够从 [TRAINING_JOB_NAME 环境变量](https://docs.aws.amazon.com/sagemaker/latest/dg/your-algorithms-training-algo -running-container.html#your-algorithms-training-algo-running-container-environment-variables)如果想试试这个。
请注意(虽然很快),指标数据 API 调用可能需要一些时间:在理想情况下,您可以异步执行它们以避免减慢您的训练工作。
相关内容
- AWS 官方已更新 1 年前
- AWS 官方已更新 2 年前
- AWS 官方已更新 9 个月前