Amazon Bedrock オンデマンドリソースを使用するときに発生する、503 Service Unavailable エラーをトラブルシューティングしたいです。AWS アカウントごとの制限は超えていません。
**注:**AWS コマンドラインインターフェイス (AWS CLI) コマンドの実行中にエラーが発生した場合は、「AWS CLI エラーのトラブルシューティング」を参照してください。また、AWS CLI の最新バージョンを使用していることを確認してください。
Amazon Bedrockは、特定のサーバー側の例外に対して 503 Service Unavailable エラーコードを返します。
サーバー側の例外は、障害が原因でサーバーが応答できない場合や、要求の数が急増した場合に発生します。この急増により、共有リソースに負荷がかかります。このエラーの原因を特定するには、次の操作を行います。
エラーが API 需要の一時的な増加によるものかどうかを確認するには、増加した需要を解決する必要があります。エクスポネンシャルバックオフを使用してリクエストを再試行します。AWS SDK を使用している場合は、「再試行の動作」を参照してください。
ある AWS リージョンで需要が増加したり、障害が発生したりしているかどうかを確認するには、別の AWS リージョンを使用するようにリソースの設定を変更します。別のリージョンに変更するときに、そのリージョンの Amazon Bedrock でモデルアクセスを有効にします。AWS SDK を使用している場合は、「AWS SDK との互換性」を参照してください。
トラフィックを複数のリージョンに自動的にルーティングするには、クロスリージョン推論を有効にします。
特定の基盤モデルで需要が増加したり、障害が発生したりしても、他の基盤モデルは問題なく動作する可能性があります。
注:
より高いレベルのスループットをプロビジョニングするには、Provisioned Throughput を購入してください。詳細については、「Amazon Bedrock 基盤モデルへのアクセス」を参照してください。AWS マネジメントコンソールの場合は、「Provisioned Throughput を使用する」を参照してください。AWS CLI または Python SDK の場合は、「Amazon Bedrock での Provisioned Throughput 用コードの例」を参照してください。Provisioned Throughput がサポートされているリージョンとモデルで使用できます。