1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 首先,通常情况下你不需要直接在处理脚本中与S3进行交互:在配置了 ProcessingOutput
的情况下,你的脚本保存在 /opt/ml/processing/output
中的任何文件都会自动上传到你设定的 s3://...
目标S3桶的地址里。当然,可能会有特殊情况需要直接从脚本中访问S3,但通常处理作业输入和输出应该为你做好了,这让你的代码更简洁明了。
我不是 Pandas Profiler 专家,但我认为你的错误可能来自这里:
```output_path_tblforprofile = ('profile_case.html')
print(output_path_tblforprofile)
profile_tblforprofile.to_file(output_path_tblforprofile)
这段代码的意图不就是将报告保存到当前工作目录下的 `profile_case.html` 中吗?但这不是 `/opt/ml/processing/output` 目录,这通常是脚本下载到容器中的文件夹。FileNotFound 错误告诉你该 HTML 文件没有在你期望的文件夹中创建。
所以,我建议你将输出路径明确设置为 `/opt/ml/processing/output/profile_case.html`,并且删掉最后的 boto3/s3 部分
相关内容
- AWS 官方已更新 2 个月前
- AWS 官方已更新 9 个月前