Amazon SageMaker AI JumpStart와 관련된 일반적인 문제를 해결하고 싶습니다.
해결 방법
SageMaker 파운데이션 모델을 볼 수 없음
SageMaker AI 콘솔 또는 SageMaker AI Studio에서 SageMaker AI 파운데이션 모델을 볼 수 없는 경우 다음 오류 중 하나가 표시될 수 있습니다.
"There's been an error with your request. Please retry and contact support."
"Something went wrong: Please ensure that your account is authorized to read from Amazon S3"
이러한 오류는 aws-marketplace 정책에 액세스할 수 있는 AWS Identity and Access Management(IAM) 권한이나 Amazon Simple Storage Service(Amazon S3)에 대한 읽기 또는 쓰기 권한이 없을 때 발생합니다.
SageMaker AI 파운데이션 모델에 액세스하려면 AmazonSageMakerFullAccess 관리형 정책을 사용하십시오. 이 정책에 액세스할 수 없는 경우 SageMaker AI 파운데이션 모델 허브에 필요한 권한이 포함된 범위 축소 정책을 사용하십시오.
SageMaker AI 콘솔에서 오류가 발생한 경우, IAM 런타임 역할에 다음 정책을 추가합니다.
{
"Effect": "Allow",
"Action": [
"s3:GetObject"
],
"Resource": "arn:aws:s3:::example-bucket/*",
"Condition": {
"StringEqualsIgnoreCase": {
"s3:ExistingObjectTag/SageMaker": "true"
}
}
},
{
"Effect": "Allow",
"Action": [
"s3:GetObject"
],
"Resource": "arn:aws:s3:::example-bucket/*",
"Condition": {
"StringEquals": {
"s3:ExistingObjectTag/servicecatalog:provisioning": "true"
}
}
}
참고: example-bucket을 Amazon S3 버킷으로 바꾸십시오.
SageMaker AI Studio에서 오류가 발생한 경우, 도메인 런타임 역할에 다음 정책을 추가합니다.
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"sagemaker:InvokePlaygroundEndpoint",
"aws-marketplace:Subscribe",
"aws-marketplace:ViewSubscriptions"
],
"Resource": [
"*"
]
},
{
"Effect": "Allow",
"Action": [
"lambda:InvokeFunction"
],
"Resource": [
"arn:aws:lambda:*:*:function:SageMakerFoundationHubAppConfigLambdaFunction"
]
}
]
}
"HeadObject operation: Not Found" 오류 발생
모델의 최신 버전을 사용하기 위해 SageMaker AI Studio 노트북 model_version 속성을 *로 설정하면 다음과 같은 오류 메시지가 표시될 수 있습니다.
"An error occurred (404) when calling the HeadObject operation: Not Found"
이 오류는 SageMaker가 압축되지 않은 모델 아티팩트를 사용하도록 모든 모델을 업데이트할 경우 발생합니다. 이 문제를 해결하려면 노트북 model_version 속성을 정확한 모델 버전으로 설정하십시오.
"Your invocation timed out" 오류 발생
호출을 처리하는 데 지정된 시간(초)보다 오래 걸리면 호출 시간 초과가 발생합니다. 그 결과 다음과 같은 오류 메시지가 표시됩니다.
"Error: Your invocation timed out while waiting for a response from container primary. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again."
이 문제를 해결하려면 처리 시간을 안전한 임계값으로 설정하십시오.
호출 시간 초과를 피하려면 다음 모범 사례를 사용하십시오.
- 처리 시간을 지정된 임계값 이하로 유지하려면 생성된 토큰 수를 제한합니다.
- 필요한 경우 입력을 여러 개의 호출로 분할합니다. 또한 응답을 결합하여 컨텍스트를 제공합니다.
- 스트리밍 응답을 사용합니다.
- 병렬 요청 또는 다중 테넌트 환경이 느린 경우, 최대 토큰에 대한 안전 임계값을 증가시킵니다.
또한 시간 초과가 여러 번 반복되도록 하는 boto3 클라이언트의 자동 재시도를 끄는 것이 좋습니다.
import botocore; config=botocore.config.Config(retries=dict(max_attempts=0))
계속해서 문제를 해결하려면 Amazon Bedrock 또는 SageMaker AI 추론 엔드포인트에 대한 Amazon CloudWatch 지표를 확인하십시오.
관련 정보
사용자 지정 IAM 실행 역할에 대한 Amazon SageMaker JumpStart 활성화
SageMaker 웹 사이트의 사전 학습된 모델 테이블이 포함된 내장 알고리즘
GitHub 웹 사이트의 JumpStart 소개 - 텍스트를 이미지로