在Glue中访问S3返回报错:403 Access denied error

0

【以下的问题经过翻译处理】 数据以CSV格式上传至S3存储桶中,使用Glue对其进行爬取。添加一个爬虫,将其指向S3存储桶,并为其设置了一个具有AWSGLueServiceRole托管策略的IAM角色。 运行爬虫,在存储桶中有多个CSV文件的情况下,没有识别出任何表。检查了CloudWatch日志,发现爬虫在从S3获取文件时收到了403 Access denied error:

ERROR : Error Access Denied (Service: Amazon S3; Status Code: 403; Error Code: AccessDenied; Request ID: 4A6CA0B1723E03DC) retrieving file at s3://data-lake-us-east-1-930604210392/rJEzO-5Jb/1493993509425/Unemployment_Insurance_Recipients_and_UI_Benefit_Payments_by_County__Monthly_.csv. Tables created did not infer schemas from this file.

是AWSGlueServiceRole托管策略应该给予对S3的更多的访问权限问题吗?

profile picture
EXPERTE
gefragt vor 5 Monaten47 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 IAM角色需要访问它无法访问的S3存储桶。AWSGlueServiceRole策略仅允许从名称为aws-glue-*的资源获取对象。需要附加另一个策略或创建自己的策略才能在该S3存储桶上运行Glue作业。

profile picture
EXPERTE
beantwortet vor 5 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen