AWS EMR (HDFS + Spark) - AWS EMR (Spark)

0

【以下的问题经过翻译处理】 针对这两个选项,在创建数据湖时有什么区别?

profile picture
专家
已提问 4 个月前16 查看次数
1 回答
0

【以下的回答经过翻译处理】 HDFS是Hadoop的一个分布式、可扩展和可移植的文件系统。HDFS的优点是在Hadoop集群节点之间管理集群和管理单个步骤的Hadoop集群节点之间具有数据感知性。欲了解更多信息,请查看Hadoop文档。

HDFS由主节点和核心节点使用。它的一个优点是速度快,缺点是它是临时存储,当集群结束时会被回收。它最适合用于缓存立即作业流程步骤产生的结果。 https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-file-systems.html

profile picture
专家
已回答 4 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则