在Glue中访问S3返回报错:403 Access denied error

0

【以下的问题经过翻译处理】 数据以CSV格式上传至S3存储桶中,使用Glue对其进行爬取。添加一个爬虫,将其指向S3存储桶,并为其设置了一个具有AWSGLueServiceRole托管策略的IAM角色。 运行爬虫,在存储桶中有多个CSV文件的情况下,没有识别出任何表。检查了CloudWatch日志,发现爬虫在从S3获取文件时收到了403 Access denied error:

ERROR : Error Access Denied (Service: Amazon S3; Status Code: 403; Error Code: AccessDenied; Request ID: 4A6CA0B1723E03DC) retrieving file at s3://data-lake-us-east-1-930604210392/rJEzO-5Jb/1493993509425/Unemployment_Insurance_Recipients_and_UI_Benefit_Payments_by_County__Monthly_.csv. Tables created did not infer schemas from this file.

是AWSGlueServiceRole托管策略应该给予对S3的更多的访问权限问题吗?

profile picture
专家
已提问 5 个月前42 查看次数
1 回答
0

【以下的回答经过翻译处理】 IAM角色需要访问它无法访问的S3存储桶。AWSGlueServiceRole策略仅允许从名称为aws-glue-*的资源获取对象。需要附加另一个策略或创建自己的策略才能在该S3存储桶上运行Glue作业。

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则