Salta al contenuto

Come posso risolvere l'errore "503 Service Unavailable" in Amazon Bedrock?

3 minuti di lettura
0

Desidero risolvere l'errore "503 Service Unavailable" che ricevo quando utilizzo le risorse on demand di Amazon Bedrock. Non ho superato le quote dell'account AWS.

Risoluzione

Nota: se ricevi errori quando esegui i comandi dell'Interfaccia della linea di comando AWS (AWS CLI), consulta Risoluzione degli errori per AWS CLI. Inoltre, assicurati di utilizzare la versione più recente di AWS CLI.

Ricevi il messaggio di errore 503 Service Unavailable per eccezioni sul lato server che si verificano quando il server non è in grado di rispondere a causa di guasti. Oppure quando un aumento delle richieste sollecita eccessivamente le risorse condivise. Per identificare la causa dell'errore, intraprendi le seguenti azioni.

Verifica lo stato del servizio

Se non riesci ad accedere ad Amazon Bedrock, verifica la disponibilità del servizio. Controlla l'integrità del servizio sulla Dashboard AWS Health per verificare se sono presenti problemi con Amazon Bedrock in quella specifica Regione AWS.

Riprova a effettuare la richiesta

Per verificare se l'errore dipende da un aumento temporaneo della domanda di API, utilizza il backoff esponenziale per ritentare la richiesta. Questo metodo riduce il carico sul server e migliora la probabilità che una richiesta vada a buon fine.

Gli SDK AWS hanno spesso una logica di ripetizione integrata. Configura il comportamento di ripetizione per l'AWS SDK in base alle esigenze del caso d'uso.

Utilizza un'altra Regione

Per verificare se l'aumento della domanda o i guasti sono specifici di una Regione, aggiorna le risorse per utilizzarne un'altra. Quando passi a una Regione diversa, concedi l'accesso al modello per Amazon Bedrock in quella Regione.

Se utilizzi gli SDK AWS, verifica la compatibilità della Regione dell'AWS SDK. Per aggiornare l'AWS SDK in modo che utilizzi un'altra Regione, esegui questo comando AWS CLI set:

aws configure set region new-region-name

Nota: sostituisci new-region-name con la nuova Regione.

Utilizza l'inferenza multi-Regione per utilizzare automaticamente la capacità di più Regioni

Utilizza l'inferenza multi-Regione per gestire senza problemi i picchi di traffico imprevisti. L'inferenza multi-Regione indirizza dinamicamente le richieste alle Regioni che dispongono di capacità. Ciò consente ai carichi di lavoro di scalare in base alla domanda.

Utilizza altri modelli di fondazione

Se la domanda aumenta o si verificano errori per un modello di fondazione specifico, utilizza un altro modello di fondazione.

Nota: i parametri richiesti sono diversi per ogni modello di fondazione. L'API Converse funziona con tutti i modelli Amazon Bedrock che supportano i messaggi e consente di scrivere il codice una sola volta e utilizzarlo con diversi modelli.

Utilizza Provisioned Throughput

Prerequisiti: assicurati di trovarti in una Regione supportata per Provisioned Throughput.

Analizza i modelli di utilizzo e i requisiti di picco dell'applicazione. Se devi fornire un throughput più elevato, utilizza Provisioned Throughput. Per utilizzare Provisioned Throughput tramite AWS CLI o AWS SDK per Python (Boto3), consulta Esempi di codice per Provisioned Throughput.

AWS UFFICIALEAggiornata 8 mesi fa