Perché il mio cluster EMR non termina o termina prima del previsto quando utilizzo una policy di terminazione automatica?

3 minuti di lettura
0

Ho configurato una policy di terminazione automatica per il mio cluster Amazon EMR. Il cluster continua a funzionare come attivo o termina prima del timeout di inattività configurato nella policy di terminazione automatica.

Breve descrizione

Quando si crea un cluster EMR, è possibile attivare la policy di terminazione automatica. La policy di terminazione automatica termina il cluster dopo un determinato periodo di inattività.

Risoluzione

1.    Assicurati che il ruolo del profilo dell'istanza Amazon Elastic Compute Cloud (Amazon EC2), EMR_EC2_DefaultRole, disponga delle seguenti autorizzazioni. Se il ruolo del profilo dell'istanza EC2 di EMR non dispone di queste autorizzazioni, il cluster rimane attivo anche se soddisfa il requisito di timeout di inattività.

{
    "Version": "2012-10-17",
    "Statement": {
        "Sid": "AllowAutoTerminationPolicyActions",
        "Effect": "Allow",
        "Action": [
            "elasticmapreduce:PutAutoTerminationPolicy",
            "elasticmapreduce:GetAutoTerminationPolicy",
            "elasticmapreduce:RemoveAutoTerminationPolicy"
        ],
        "Resource": "your-resources"
    }

Nelle versioni di Amazon EMR da 5.34 a 5.36 e 6.4.0 o successive, un cluster è inattivo quando si verifica quanto segue:

  • Non ci sono applicazioni YARN attive.
  • L'utilizzo dell'HDFS è inferiore al 10%.
  • Non ci sono connessioni attive per notebook EMR o EMR Studio.
  • Non ci sono interfacce utente delle applicazioni sul cluster in uso.

Nelle versioni di Amazon EMR da 5.30.0 a 5.33.1 e da 6.1.0 a 6.3.0, un cluster è inattivo quando si verifica quanto segue:

  • Non ci sono applicazioni YARN attive.
  • L'utilizzo dell'HDFS è inferiore al 10%.
  • Il cluster non ha processi Spark attivi.

2.    Assicurati che il processo di raccolta delle metriche sia in esecuzione. Il processo di raccolta delle metriche raccoglie le metriche per determinare la terminazione automatica. Esegui i comandi seguenti per verificare il processo di raccolta delle metriche:

ps -ef|grep metrics-collector

-oppure-

systemctl status metricscollector.service

Per ulteriori informazioni, consulta la sezione In che modo è possibile riavviare un servizio su Amazon EMR?

3.    Quando attivi la terminazione automatica utilizzando una policy di terminazione automatica, Amazon EMR emette la metrica AutoTerminationClusterIdle di Amazon CloudWatch con una granularità di un minuto. Questa metrica valuta se il cluster soddisfa i requisiti relativi allo stato di inattività. Se questa metrica mostra "1", il cluster è inattivo. Se mostra "0", il cluster è ancora attivo.

Visualizza le metriche CloudWatch del cluster EMR e verifica che la metrica CloudWatch AutoTerminationisCluseterIdle sia sempre "1" nel cluster. Se è sempre "1", il cluster è idoneo per la terminazione automatica.


Informazioni correlate

Utilizzo di una policy di terminazione automatica

Monitoraggio delle metriche con CloudWatch

AWS UFFICIALE
AWS UFFICIALEAggiornata un anno fa