1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 Amazon EMR会在同一个Amazon EC2可用区中启动给定集群的所有节点。在同一个区中运行集群可以提高作业流的性能,因为它提供了更高的数据访问速率。默认情况下,Amazon EMR会选择资源最丰富的可用区来运行您的集群。但是,如果需要,您可以指定其他可用区。 对于配置实例群组: 选择VPC和一个或多个子网来部署您的Amazon EMR集群。我们建议选择多个可用区。集群仍将部署在单个可用区中,但选择多个可用区允许Amazon EMR跨所有选定的可用区查找可用的EC2 Spot容量,从而在可用区中部署您的集群。 针对“在EMR上使用HBase的可用性”问题: 如果您的应用程序不需要支持写入的高可用性,并且可以容忍写入/更新期间的故障,则可以推荐使用Amazon S3上的Apache HBase。如果您想要缓解Amazon EMR主节点故障(或可能导致Apache HBase on Amazon S3集群终止或由于Apache HBase RegionServer操作/短暂问题而导致任何临时服务降级的可用性区域故障),建议数据处理架构依赖于一个流/消息平台,该平台位于Apache HBase on Amazon S3集群的上游。我们建议您始终使用最新的Amazon EMR版本,以便您可以受益于不断添加到Apache HBase的所有更改和功能。
相关内容
- AWS 官方已更新 2 个月前
- AWS 官方已更新 1 年前
- AWS 官方已更新 6 个月前
- AWS 官方已更新 1 年前