¿Cómo soluciono los problemas comunes de SageMaker AI JumpStart?

4 minutos de lectura
0

Quiero solucionar problemas comunes con Amazon SageMaker AI JumpStart.

Resolución

No puede ver los modelos básicos de SageMaker

Si no puede ver los modelos básicos de SageMaker AI en la consola de SageMaker AI o SageMaker AI Studio, es posible que reciba uno de los siguientes errores:

«Se ha producido un error en la solicitud. Vuelva a intentarlo y póngase en contacto con el servicio de asistencia».

«Algo salió mal: Asegúrese de que su cuenta está autorizada a leer desde Amazon S3»

Estos errores se producen cuando no tiene el permiso de AWS Identity and Access Management (IAM) para acceder a las políticas de aws-marketplace o los permisos de lectura o escritura para Amazon Simple Storage Service (Amazon S3).

Para acceder a los modelos básicos de SageMaker AI, utilice la política administrada AmazonSageMakerFullAccess. Si no tiene acceso a esta política, utilice una política de ámbito reducido que incluya los permisos necesarios para el centro de modelos de SageMaker AI Foundation.

Si ha recibido el error en la consola de SageMaker AI, agregue la siguiente política a su rol de ejecución de IAM:

{
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEqualsIgnoreCase": {
                    "s3:ExistingObjectTag/SageMaker": "true"
                }
            }
        },
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEquals": {
                    "s3:ExistingObjectTag/servicecatalog:provisioning": "true"
                }
            }
        }

Nota: Sustituya example-bucket por su bucket de Amazon S3.

Si ha recibido el error de SageMaker AI Studio, agregue la siguiente política a su rol de versión ejecutable de dominio:

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "sagemaker:InvokePlaygroundEndpoint",
                "aws-marketplace:Subscribe",
                "aws-marketplace:ViewSubscriptions"
            ],
            "Resource": [
                "*"
            ]
        },
        {
            "Effect": "Allow",
            "Action": [
                "lambda:InvokeFunction"
            ],
            "Resource": [
                "arn:aws:lambda:*:*:function:SageMakerFoundationHubAppConfigLambdaFunction"
            ]
        }
    ]
}

Se mostrará el error «operación HeadObject: no se ha encontrado»

Al establecer el atributo model_version del cuaderno de SageMaker AI Studio en * para usar la versión más reciente del modelo, es posible que reciba el siguiente mensaje de error:

«Se produjo un error (404) al llamar a la operación HeadObject: no se ha encontrado»

Este error se produce cuando SageMaker actualiza todos los modelos para usar artefactos de modelo sin comprimir. Para resolver este problema, defina el atributo model_version de su cuaderno en una versión exacta del modelo.

Se muestra el error «Se ha agotado el tiempo de espera de la invocación»

Se agota el tiempo de espera de la invocación cuando la invocación tarda más de un número especificado de segundos en procesarse. Como resultado, se mostrará el siguiente mensaje de error:

«Error: Se ha agotado el tiempo de espera de la invocación mientras esperaba una respuesta del contenedor primario. Revise las métricas de latencia de cada contenedor de Amazon CloudWatch, resuelva el problema e inténtelo de nuevo».

Para resolver este problema, establezca el tiempo de procesamiento en un umbral seguro.

Para evitar que se agote el tiempo de espera de la invocación, siga estas prácticas recomendadas:

  • Para mantener el tiempo de procesamiento por debajo del umbral especificado, limite la cantidad de tokens generados.
  • Si es necesario, divida la entrada en varias invocaciones. Además, combine las respuestas para proporcionar contexto.
  • Use una respuesta de streaming.
  • Si las solicitudes paralelas o los entornos de varios inquilinos son lentos, aumente su umbral de seguridad con el máximo de tokens.

Además, se recomienda desactivar los reintentos automáticos del cliente boto3 que provocan que el tiempo de espera se repita varias veces:

import botocore; config=botocore.config.Config(retries=dict(max_attempts=0))

Para seguir solucionando problemas, consulte las métricas de Amazon CloudWatch para los puntos de enlace de inferencia de Amazon Bedrock o SageMaker AI.

Información relacionada

Habilitación de Amazon SageMaker JumpStart para roles de ejecución de IAM personalizados

Algoritmos integrados con una tabla de modelos previamente entrenada en el sitio web de SageMaker

Introducción a JumpStart: texto a imagen en el sitio web de GitHub