基于工作负载一致请求的EC2自动扩展

0

【以下的问题经过翻译处理】 你好!

我想要创建一个需要大量计算能力的应用程序(一个能够制作具有稳定扩散效果的图像的API)。因此,我将使用EC2实例来进行计算。我的后端入口将是Amazon API Gateway,它仅会处理很少的请求(比如3个),每个请求都具有非常一致(已知)的工作量。用户请求的数量可能会在(相对)短的时间内大幅变化(上升和下降)。

在成本效益方面,要扩展这种工作量,最好的方法是什么?我尝试查看“负载均衡器”,但我没有找到一个好的使用方法来实现这个目的。我考虑创建一个SQS队列来存储请求,并在请求堆积过多时扩大我的EC2实例。这是一个好主意吗?如果是,最佳实现方法是什么?

我非常期待您的回复!先感谢您。基于工作负载一致请求的EC2自动扩展

1 回答
0

【以下的回答经过翻译处理】 是的,SQS经常用于像这样的“工作层”前面,其中EC2 Autoscaling Group中的实例具有由队列深度指标驱动的扩展策略,或者如果是由工作节点生成的特定于应用程序的自定义指标,可能可以提供更好的缩放性能。 API Gateway可以与SQS接口。

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则