Common Crawl中文数据处理速度过慢

0

访问及处理Common Crawl中文数据速度过慢,尤其是2020年及之前的部分,相对2022年及之后的数据,处理速度慢很多倍

asked a year ago197 views
1 Answer
0

原因可能狠多。Schema 比2020年复杂了,处理文件数量比2020年多,以及其他原因,都可能造成 Glue Crawler在发现 schema 时,花费更多的时间。

profile picture
answered 8 months ago

You are not logged in. Log in to post an answer.

A good answer clearly answers the question and provides constructive feedback and encourages professional growth in the question asker.

Guidelines for Answering Questions