EMR上的HBase - 多可用区可用性

0

【以下的问题经过翻译处理】 对于EMR主节点部署在单个可用区的情况感到不满(例如数据可以存在S3中,因此可以在可用区故障的情况下存活)。发现即使有多个主节点,它们也被部署在单个子网中,因此只能在一个可用区中。寻找一种可以自动故障转移至另一个可用区的解决方案。

profile picture
ESPERTO
posta un anno fa24 visualizzazioni
1 Risposta
0

【以下的回答经过翻译处理】 Amazon EMR会在同一个Amazon EC2可用区中启动给定集群的所有节点。在同一个区中运行集群可以提高作业流的性能,因为它提供了更高的数据访问速率。默认情况下,Amazon EMR会选择资源最丰富的可用区来运行您的集群。但是,如果需要,您可以指定其他可用区。 对于配置实例群组: 选择VPC和一个或多个子网来部署您的Amazon EMR集群。我们建议选择多个可用区。集群仍将部署在单个可用区中,但选择多个可用区允许Amazon EMR跨所有选定的可用区查找可用的EC2 Spot容量,从而在可用区中部署您的集群。 针对“在EMR上使用HBase的可用性”问题: 如果您的应用程序不需要支持写入的高可用性,并且可以容忍写入/更新期间的故障,则可以推荐使用Amazon S3上的Apache HBase。如果您想要缓解Amazon EMR主节点故障(或可能导致Apache HBase on Amazon S3集群终止或由于Apache HBase RegionServer操作/短暂问题而导致任何临时服务降级的可用性区域故障),建议数据处理架构依赖于一个流/消息平台,该平台位于Apache HBase on Amazon S3集群的上游。我们建议您始终使用最新的Amazon EMR版本,以便您可以受益于不断添加到Apache HBase的所有更改和功能。

profile picture
ESPERTO
con risposta un anno fa

Accesso non effettuato. Accedi per postare una risposta.

Una buona risposta soddisfa chiaramente la domanda, fornisce un feedback costruttivo e incoraggia la crescita professionale del richiedente.

Linee guida per rispondere alle domande