AWS EMR (HDFS + Spark) - AWS EMR (Spark)

0

【以下的问题经过翻译处理】 针对这两个选项,在创建数据湖时有什么区别?

profile picture
EXPERTE
gefragt vor 5 Monaten28 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 HDFS是Hadoop的一个分布式、可扩展和可移植的文件系统。HDFS的优点是在Hadoop集群节点之间管理集群和管理单个步骤的Hadoop集群节点之间具有数据感知性。欲了解更多信息,请查看Hadoop文档。

HDFS由主节点和核心节点使用。它的一个优点是速度快,缺点是它是临时存储,当集群结束时会被回收。它最适合用于缓存立即作业流程步骤产生的结果。 https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-file-systems.html

profile picture
EXPERTE
beantwortet vor 5 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen

Relevanter Inhalt