如何设置 CloudWatch 警报以自动恢复 EC2 实例?

1 分钟阅读
0

我想使用 Amazon CloudWatch 设置 Amazon Elastic Compute Cloud(Amazon EC2)实例的自动恢复。

简短描述

如果您的实例未通过系统状态检查,您可以使用 CloudWatch 警报操作自动恢复您的实例。90% 以上部署的 Amazon EC2 实例均支持此恢复选项。但此恢复选项仅适用于系统检查失败的情况,而不适用于状态检查失败的情况。此外,如果您终止了自己的实例,则无法恢复。

如果您的实例未通过状态检查,则可能需要重启实例或更改配置。有关更多信息,请参阅状态检查的类型

解决方法

创建警报

1.    打开 Amazon EC2 控制台

2.    在导航窗格中,选择 Instances(实例)。

3.    选择您要配置的实例。

4.    选择 Actions(操作),然后选择 Monitor and troubleshoot(监控和问题排查)。然后选择 Manage CloudWatch alarms(管理 CloudWatch 警报)。

5.    选择 Create an alarm(创建警报)。
注意:要创建警报,您必须具有停止和启动所关联实例的 AWS Identity and Access Management (IAM) 权限。有关更多信息,请参阅创建 IAM 角色

6.    对于 Alarm notification(警报通知),选择一个现有的 Amazon Simple Notification Service(Amazon SNS)主题。要创建新主题,请参阅创建 Amazon SNS 主题。 **注意:**要在警报触发时接收通知,您必须订阅该 SNS 主题

7.    单击 Alarm action(警报操作),然后选择 Recover(恢复)。

8.    对于 Group samples by(样本分组依据)和 Type of data to sample(要采样的数据类型),根据您的使用案例选择适当的统计数据和指标。

9.    对于 Consecutive period(连续周期)和 Period(周期),指定警报的评估周期。

10.    (可选)修改自动创建的 Alarm name(警报名称)。

11.    选择 Create(创建)。

设置要重启的警报

1.    打开 CloudWatch 控制台

2.    在导航窗格中,选择 All Alarms(所有警报)。

3.    选择您创建的警报。选择 Action(操作),然后选择 Edit(编辑)。

4.    在“其他配置”部分,选择 Treat missing data as bad (breaching threshold) [将缺失的数据视为不良数据(超过阈值)]。

5.    选择保存


相关信息

创建停止、终止、重启或恢复实例的警报

相关视频

AWS 官方
AWS 官方已更新 1 年前