Wie behebe ich häufig auftretende Probleme mit SageMaker AI JumpStart?

Lesedauer: 3 Minute
0

Ich möchte häufig auftretende Probleme mit Amazon SageMaker AI JumpStart beheben.

Lösung

Du kannst SageMaker-Basismodelle nicht anzeigen

Wenn du die SageMaker AI-Basismodelle auf der SageMaker AI-Konsole oder in SageMaker AI Studio nicht anzeigen kannst, wird möglicherweise eine der folgenden Fehlermeldungen angezeigt:

„There's been an error with your request. Please retry and contact support.“

„Something went wrong: Please ensure that your account is authorized to read from Amazon S3“

Diese Fehler treten auf, wenn du nicht über die AWS Identity and Access Management (IAM)-Berechtigung für den Zugriff auf aws-marketplace-Richtlinien oder Lese- oder Schreibberechtigungen für Amazon Simple Storage Service (Amazon S3) verfügst.

Verwende die verwaltete AmazonSageMakerFullAccess-Richtlinie, um auf die SageMaker AI-Basismodelle zuzugreifen. Wenn du keinen Zugriff auf diese Richtlinie hast, verwende eine Scope-Down-Richtlinie, die die erforderlichen Berechtigungen für den SageMaker AI-Basismodell-Hub enthält.

Wenn du den Fehler auf der SageMaker AI-Konsole erhalten hast, füge deiner IAM-Laufzeitrolle die folgende Richtlinie hinzu:

{
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEqualsIgnoreCase": {
                    "s3:ExistingObjectTag/SageMaker": "true"
                }
            }
        },
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEquals": {
                    "s3:ExistingObjectTag/servicecatalog:provisioning": "true"
                }
            }
        }

Hinweis: Ersetze example-bucket durch deinen Amazon S3-Bucket.

Wenn du den Fehler für SageMaker AI Studio erhalten hast, füge deiner Domain-Laufzeitrolle die folgende Richtlinie hinzu:

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "sagemaker:InvokePlaygroundEndpoint",
                "aws-marketplace:Subscribe",
                "aws-marketplace:ViewSubscriptions"
            ],
            "Resource": [
                "*"
            ]
        },
        {
            "Effect": "Allow",
            "Action": [
                "lambda:InvokeFunction"
            ],
            "Resource": [
                "arn:aws:lambda:*:*:function:SageMakerFoundationHubAppConfigLambdaFunction"
            ]
        }
    ]
}

Du erhältst den Fehler „HeadObject operation: Not Found“.

Wenn du das Attribut model_version deines SageMaker AI Studio-Notebooks auf * setzt, um die neueste Version des Modells zu verwenden, erhältst du möglicherweise die folgende Fehlermeldung:

„An error occurred (404) when calling the HeadObject operation: Not Found“

Dieser Fehler tritt auf, wenn SageMaker alle Modelle aktualisiert, um unkomprimierte Modellartefakte zu verwenden. Um dieses Problem zu beheben, setze dein Notebook-Attribut model_version auf eine exakte Modellversion.

Du erhältst die Fehlermeldung „Your invocation timed out“

Ein Aufruf-Timeout tritt auf, wenn die Verarbeitung des Aufrufs länger als eine angegebene Anzahl von Sekunden dauert. Daraufhin erhältst du die folgende Fehlermeldung:

„Error: Your invocation timed out while waiting for a response from container primary. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again.“

Stelle die Verarbeitungszeit auf einen sicheren Schwellenwert ein, um dieses Problem zu beheben.

Verwende die folgenden Best Practices, um einen Timeout bei Aufrufen zu vermeiden:

  • Begrenze die Anzahl der generierten Token, um die Verarbeitungszeit unter deinem angegebenen Schwellenwert zu halten.
  • Teile die Eingabe bei Bedarf in mehrere Aufrufe auf. Kombiniere außerdem Antworten, um den Kontext bereitzustellen.
  • Verwende eine Streaming-Antwort.
  • Wenn parallele Anfragen oder Umgebungen mit mehreren Mandanten langsam sind, erhöhe deinen Sicherheitsschwellenwert für die maximale Anzahl von Tokens.

Außerdem gehört es zu den Best Practices, die automatischen Wiederholungsversuche des boto3-Clients auszuschalten, die dazu führen, dass sich das Timeout mehrmals wiederholt:

import botocore; config=botocore.config.Config(retries=dict(max_attempts=0))

Um mit der Fehlerbehebung fortzufahren, überprüfe die Amazon CloudWatch-Metriken für Amazon Bedrock- oder SageMaker AI-Inferenzendpunkte.

Ähnliche Informationen

Amazon SageMaker JumpStart für benutzerdefinierte IAM-Ausführungsrollen aktivieren

Tabelle mit integrierten Algorithmen mit vortrainierten Modellen auf der SageMaker-Website

Einführung in JumpStart – Text zu Bild auf der GitHub-Website

AWS OFFICIAL
AWS OFFICIALAktualisiert vor 3 Monaten