Ir para o conteúdo

Como soluciono problemas de reinicializações ou failovers inesperados em minhas instâncias de banco de dados compatíveis com PostgreSQL do Aurora?

4 minuto de leitura
0

Quero descobrir o que fez com que minhas instâncias de banco de dados da edição do Amazon Aurora compatível com PostgreSQL fossem reiniciadas ou apresentassem failover inesperadamente e evitar futuras ocorrências.

Breve descrição

Reinicializações inesperadas em instâncias de banco de dados compatíveis com o PostgreSQL do Aurora podem ocorrer devido a falhas de hardware, alta utilização de recursos, atraso na replicação ou problemas de software.

Resolução

Verifique os eventos do Amazon RDS em sua instância de banco de dados

Conclua as etapas a seguir:

  1. Abra o console do Amazon Relational Database Service (Amazon RDS).
  2. No painel de navegação, selecione Eventos.
  3. Procure eventos que ocorreram perto da hora em que sua instância de banco de dados foi reiniciada.

Para obter mais informações, consulte Visualizar eventos do Amazon RDS e Trabalhar com a notificação de eventos do Amazon RDS.

Analise métricas da instância de banco de dados

Conclua as etapas a seguir:

  1. Abra o console do Amazon RDS.
  2. No painel de navegação, clique em Bancos de dados.
  3. Selecione sua instância de banco de dados.
  4. Clique na guia Monitoramento.
  5. Analise as seguintes métricas:<br id=hardline_break/> Em CPUUtilization, verifique se há alto uso sustentado da CPU.<br id=hardline_break/> Em DatabaseConnections, verifique se as contagens de conexões não estão excedendo a cota.<br id=hardline_break/> Em FreeableMemory, confirme se há memória suficiente disponível.<br id=hardline_break/> Em ReadIOPS e WriteIOPS, procure padrões incomuns de E/S.<br id=hardline_break/> (Somente em instâncias de leitor) Em AuroraReplicaLag, verifique os valores de atraso de replicação.
  6. Procure anomalias ou picos que possam ter provocado a reinicialização.

Para obter mais informações, consulte Monitorar métricas do Amazon Aurora com o Amazon CloudWatch.

Consulte o CloudWatch Database Insights

Conclua as etapas a seguir:

  1. Abra o console do Amazon RDS.
  2. No painel de navegação, clique em Database Insights.
  3. No painel Database Insights, selecione sua instância de banco de dados na lista.
  4. Analise as principais consultas SQL e eventos de espera perto da hora da reinicialização.

Para obter mais informações, consulte Monitoramento de bancos de dados do Amazon Aurora com o CloudWatch Database Insights.

Verifique se há problemas de hardware

Se você suspeitar de uma falha de hardware, entre em contato com o AWS Support para solucionar o problema. O AWS Support pode verificar se um problema no nível do host provocou a reinicialização.

Analise os logs do banco de dados

Conclua as etapas a seguir:

  1. Abra o console do Amazon RDS.
  2. No painel de navegação, clique em Bancos de dados.
  3. Selecione sua instância de banco de dados.
  4. Clique na guia Logs e eventos.
  5. Na seção Logs, baixe e analise os arquivos de log do PostgreSQL em busca de erros ou avisos perto da hora da reinicialização.

Para obter mais informações sobre os arquivos de log de banco de dados do Aurora PostgreSQL, consulte Arquivos de log do banco de dados do Aurora PostgreSQL.

Verifique se há uma manutenção pendente

Conclua as etapas a seguir:

  1. Abra o console do Amazon RDS.
  2. No painel de navegação, clique em Bancos de dados.
  3. Selecione sua instância de banco de dados.
  4. Clique na guia Manutenção e backups.
  5. Se houver alguma manutenção pendente, selecione Aplicar agora ou Aplicar na próxima janela de manutenção.

Crie um alarme

Configure os alarmes do CloudWatch para métricas críticas, como utilização da CPU, uso da memória e atraso na replicação.

Otimize o uso de recursos

Realize as seguintes ações:

Escale seus recursos

Se você observar uma alta utilização de recursos de forma consistente, aumente a escala do seu tipo de instância verticalmente ou adicione réplicas do Aurora.

Mantenha seu banco de dados atualizado

Para resolver bugs e melhorar o desempenho, aplique patches e upgrades de versão regularmente.

Implemente alta disponibilidade

Em uma única instância, use implantações de instância de banco de dados Multi-AZ. Em clusters do Aurora, certifique-se de ter pelo menos uma instância de leitor que o Aurora possa promover em caso de problemas na instância do gravador.

Para obter mais informações, consulte Alta disponibilidade do Amazon Aurora.

Informações relacionadas

Ferramentas de monitoramento do Amazon Aurora

Como soluciono problemas que fazem com que minha réplica de leitura do Aurora atrase e reinicie?

Failover rápido com o Amazon Aurora PostgreSQL

AWS OFICIALAtualizada há 5 meses