Wie behebe ich den Fehler „Der Auftragsablauf konnte aufgrund eines internen Fehlers nicht gestartet werden“ in Amazon EMR?

Lesedauer: 3 Minute
0

Mein Amazon EMR-Cluster kann nicht gestartet werden, und ich erhalte die Fehlermeldung „Der Jobablauf konnte aufgrund eines internen Fehlers nicht gestartet werden.”

Kurzbeschreibung

Interne Fehler werden oft schnell behoben. Versuchen Sie Ihre Anfrage erneut. Wenn das Problem weiterhin besteht, vergewissern Sie sich, dass die Netzwerk- und Sicherheitseinstellungen des Clusters korrekt konfiguriert sind.

Behebung

Öffnen Sie die Amazon EMR-Konsole und versuchen Sie dann erneut, den Cluster zu starten. Wenn weiterhin die Meldung „Der Auftragsablauf konnte aufgrund eines internen Fehlers nicht gestartet werden“ angezeigt wird, überprüfen Sie die folgenden Einstellungen.

Berechtigungen für die Amazon EMR-Servicerolle

Sicherheitskonfigurationen, die das Root-Gerät und die Speichervolumes von Amazon Elastic Block Store (Amazon EBS) verschlüsseln, erfordern die entsprechenden Berechtigungen. Stellen Sie für diese Konfigurationen sicher, dass die Amazon EMR-Servicerolle (EMR_DefaultRole) über Berechtigungen zur Verwendung des angegebenen AWS Key Management Service (AWS KMS) -Schlüssels verfügt.

Die Servicerolle benötigt die folgenden Berechtigungen, um EMR-Cluster erfolgreich zu starten:

{
  "Version": "2012-10-17",
  "Statement": [{
    "Sid": "EmrDiskEncryptionPolicy",
    "Effect": "Allow",
    "Action": [
      "kms:Encrypt",
      "kms:Decrypt",
      "kms:ReEncrypt*",
      "kms:CreateGrant",
      "kms:GenerateDataKeyWithoutPlaintext",
      "kms:DescribeKey"
    ],
    "Resource": [
      "arn:aws:kms:us-west-2:<account-id>:key/<key-id>"
    ]
  }]
}

Wenn die EMR-Cluster-Instances ausfallen, wird möglicherweise einer der folgenden Fehler angezeigt:

2022-10-17 15:59:24,736 attempt 12/1000: http://repo.eu-west-1.amazonaws.com/2018.03/main/mirror.list
2022-10-17 15:59:34,741 exception: [Errno 12] Timeout on http://repo.eu-west-1.amazonaws.com/2018.03/main/mirror.list: (28, 'Connection timed out after 10001 milliseconds')
2022-10-17 15:59:34,741 attempt 13/1000: http://repo.eu-west-1.amazonaws.com/2018.03/main/mirror.list
2022-10-17 15:59:44,749 exception: [Errno 12] Timeout on http://repo.eu-west-1.amazonaws.com/2018.03/main/mirror.list: (28, 'Connection timed out after 10000 milliseconds')

Um diese Fehler zu beheben, überprüfen Sie das Systemprotokoll, indem Sie die folgenden Schritte ausführen:

1.    Öffnen Sie die Amazon Elastic Compute Cloud (Amazon EC2)-Konsole.

2.    Wählen Sie den EC2-Knoten aus, der aufgrund eines Clusterausfalls beendet wurde.

        Hinweis: Der terminierte Knoten ist nur für 1-2 Stunden auf der EC2-Konsole verfügbar.

3.    Wählen Sie die Dropdownliste Aktionen und dann Überwachen.

4.    Wählen Sie Problembehandlung und dann Systemprotokoll abrufen.

Subnetzrouten für virtuelle private Clouds (VPC)

Stellen Sie sicher, dass die VPC-Subnetzrouten für die Datenquelle, die Ihr Cluster verwendet, korrekt konfiguriert sind. Folgen Sie den Schritten unter Einrichten einer VPC zum Hosten von Clustern.

Sicherheitsgruppen

Stellen Sie sicher, dass die Master- und Core-/Task-Sicherheitsgruppen für das Subnetz korrekt konfiguriert sind. Weitere Informationen finden Sie unter Arbeiten mit von Amazon EMR verwalteten Sicherheitsgruppen.

Alle erforderlichen Aktionen in Ihrem EMR-Cluster müssen auch in den standardmäßigen Amazon EMR-Rollen und der Instance-Profilrolle zulässig sein.

Nachdem die VPC-Subnetzrouten, Sicherheitsgruppen und Rollen konfiguriert wurden, starten Sie einen neuen Cluster.


Ähnliche Informationen

Netzwerk konfigurieren

AWS OFFICIAL
AWS OFFICIALAktualisiert vor einem Jahr