EMR上的HBase - 多可用区可用性

0

【以下的问题经过翻译处理】 对于EMR主节点部署在单个可用区的情况感到不满(例如数据可以存在S3中,因此可以在可用区故障的情况下存活)。发现即使有多个主节点,它们也被部署在单个子网中,因此只能在一个可用区中。寻找一种可以自动故障转移至另一个可用区的解决方案。

profile picture
专家
已提问 1 年前23 查看次数
1 回答
0

【以下的回答经过翻译处理】 Amazon EMR会在同一个Amazon EC2可用区中启动给定集群的所有节点。在同一个区中运行集群可以提高作业流的性能,因为它提供了更高的数据访问速率。默认情况下,Amazon EMR会选择资源最丰富的可用区来运行您的集群。但是,如果需要,您可以指定其他可用区。 对于配置实例群组: 选择VPC和一个或多个子网来部署您的Amazon EMR集群。我们建议选择多个可用区。集群仍将部署在单个可用区中,但选择多个可用区允许Amazon EMR跨所有选定的可用区查找可用的EC2 Spot容量,从而在可用区中部署您的集群。 针对“在EMR上使用HBase的可用性”问题: 如果您的应用程序不需要支持写入的高可用性,并且可以容忍写入/更新期间的故障,则可以推荐使用Amazon S3上的Apache HBase。如果您想要缓解Amazon EMR主节点故障(或可能导致Apache HBase on Amazon S3集群终止或由于Apache HBase RegionServer操作/短暂问题而导致任何临时服务降级的可用性区域故障),建议数据处理架构依赖于一个流/消息平台,该平台位于Apache HBase on Amazon S3集群的上游。我们建议您始终使用最新的Amazon EMR版本,以便您可以受益于不断添加到Apache HBase的所有更改和功能。

profile picture
专家
已回答 1 年前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则