Como posso usar a ferramenta atop para obter estatísticas históricas de utilização de processos na minha instância do EC2 Linux?

5 minuto de leitura
0

Quero monitorar o histórico de uso de recursos na minha instância do Amazon Elastic Compute Cloud (Amazon EC2). Como posso usar a ferramenta atop para fazer isso?

Breve descrição

A ferramenta atop é uma ferramenta de monitoramento de performance que registra o uso histórico de recursos para análise posterior. Essa ferramenta também pode gerar relatórios em tempo real. Você pode consultar o uso para utilização da CPU, consumo de memória e E/S de disco de cada processo e thread. A ferramenta atop permanece ativa como um serviço em segundo plano enquanto registra as estatísticas, permitindo uma análise de longo prazo do servidor. As estatísticas são armazenadas por 28 dias, por padrão.

Nota: o Atop começa a registrar dados somente após a instalação. Os dados históricos de performance dos processos não podem ser recuperados antes da data de instalação do atop.

Resolução

Instalar o atop

Para obter instruções de instalação, consulte How do I configure the ATOP and SAR monitoring tools for my EC2 instance running Amazon Linux, RHEL, CentOS, or Ubuntu?

Leia os logs de relatórios do atop para avaliação e análise do histórico

A ferramenta atop cria arquivos de logs em /var/log/atop. Esses arquivos são nomeados no seguinte formato atop_ccaammdd. Por exemplo, atop_20210902 é a gravação de 2 de setembro de 2021.

Para acessar o arquivo de log, execute o comando atop -r atoplogfilepath. Substitua atoplogfilepath pelo caminho completo para o arquivo de log do atop. O comando e o arquivo de log aparecem conforme exibido no exemplo a seguir:

atop -r /var/log/atop/atop_20210902 

ATOP - ip-172-20-139-91                2021/09/02  17:03:44                ----------------                 3h33m7s elapsed
PRC |  sys    6.51s  |  user   7.85s  |  #proc    103  |  #tslpi    81 |  #tslpu     0  |  #zombie    0  |  #exit      0  |
CPU |  sys     0%  |  user      3%  |  irq       0%  |  idle    197% |  wait      0%  |  ipc notavail  |  curscal   ?%  |
cpu |  sys     0%  |  user      1%  |  irq       0%  |  idle     98% |  cpu000 w  0%  |  ipc notavail  |  curscal   ?%  |
cpu |  sys     0%  |  user      1%  |  irq       0%  |  idle     98% |  cpu001 w  0%  |  ipc notavail  |  curscal   ?%  |

No exemplo de saída anterior, o primeiro snapshot registrado foi em 2021/09/02 17:03:44. Para avançar para o próximo snapshot, pressione a tecla t (minúscula) no teclado. Para voltar para o snapshot anterior, pressione a tecla T (maiúsculo).

Para analisar um intervalo de tempo específico, pressione a tecla b e insira a data e a hora. A ferramenta atop pula para a hora especificada na variável Enter new time (Inserir nova hora):

NET |  lo      ----  |  pcki       2  |  pcko       2  |  sp    0 Mbps |  si    0 Kbps  |  so    0 Kbps  |  erro       0  |
Enter new time (format [YYYYMMDD]hhmm):
  PID              TID              RDDSK              WRDSK             WCANCL              DSK             CMD        1/4

Teclas de atalhos

Você pode pressionar as teclas de atalho para ver diferentes estatísticas. Veja a seguir exemplos de teclas de atalho:

Tecla de atalhoDescrição
gInformações genéricas (padrão).
mDetalhes da memória.
dDetalhes do disco.
nDetalhes da rede. Esta chave funciona somente quando o módulo do kernel netatop está instalado.
cLinha de comando completa por processo

Você pode usar as seguintes teclas de atalho para classificar a lista de processos:

Tecla de atalhoClassificar por
CAtividade da CPU.
MConsumo de memória.
DAtividade do disco.
NAtividade da rede. Esta chave só funcionará se o kernel netatop estiver instalado.
AO recurso de sistema mais ativo (modo automático).

Pressione a tecla h para ver a documentação de ajuda.

O comando atopsar

O comando atopsar é um recurso semelhante ao comando tradicional do UNIX sar. Você pode gerar vários relatórios de atividades do sistema usando o comando atopsar.

O comando atopsar usa codificação por cores e marcadores (mediante solicitação) para destacar a utilização de um recurso. A utilização crítica é marcada em vermelho e a quase crítica é marcada em ciano.

Ao usar o sinalizador -c no exemplo a seguir, será gerado um relatório sobre a utilização atual da CPU do sistema. O exemplo a seguir mostra dois resultados, com um segundo de diferença.

$ atopsar -c 1 2

ip-172-20-139-91  4.14.238-182.422.amzn2.x86_64  #1 SMP Tue Jul 20 20:35:54 UTC 2021  x86_64  2021/09/02

-------------------------- analysis date: 2021/09/02 --------------------------

18:50:16  cpu  %usr %nice %sys %irq %softirq  %steal %guest  %wait %idle  _cpu_
18:50:17  all     0     0    0    0        0       0      0      0   200
            0     0     0    0    0        0       0      0      0   100
            1     0     0    0    0        0       0      0      0   100
18:50:18  all     0     0    0    0        0       0      0      0   200
            0     0     0    0    0        0       0      0      0   100
            1     0     0    0    0        0       0      0      0   100

O comando atopsar também pode analisar dados históricos. Por exemplo, execute o seguinte comando para gerar todos os relatórios (-A) começando às 13h00 (-b) e terminando às 13h35 (-e) para o dia atual.

atopsar -A -b 13:00 -e 13:35

É possível ler o arquivo dos dias anteriores usando a opção -r e especificando o nome do arquivo de log.


Informações relacionadas

Why is my EC2 Linux instance becoming unresponsive due to over-utilization of resources?

AWS OFICIAL
AWS OFICIALAtualizada há um ano