1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 您好,
我基于和您给的相同的S3文件夹结构,进行了测试。
指定的包含路径为: s3://bucket/basefolder/
排除模式为:
**/logfolder/**
使用以上排除模式,可以让爬虫crawler忽略所有名为“logfolder”的文件夹中的文件。 您可以参考 - https://docs.aws.amazon.com/glue/latest/dg/define-crawler.html#crawler-data-stores-exclude
相关内容
- AWS 官方已更新 4 年前
- AWS 官方已更新 5 个月前
- AWS 官方已更新 3 年前
- AWS 官方已更新 3 个月前