1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 我个人认为最好的方法是启用容器洞察功能,它将为您提供ECS / ContainersInsights指标,这些指标将计算运行/挂起/所需任务的数量,从而允许您使用这些指标。我强烈建议将这些值组合成复合警报,例如将运行+挂起与所需进行比较。 如果您还没有这样做,我强烈建议为容器设置HealthCheck的值,以避免任务运行但实际上不起作用。 您也可以发布自定义指标,可能与业务相关(例如销售数量,用户数量等)。这些指标只会在服务健康时发布,因此您可以设置警报,例如如果没有数据点,则进入ALARM状态。