Amazon Aurora PostgreSQL 互換エディションのリードレプリカにおけるレプリカの遅延、接続の問題、またはフェイルオーバーのトラブルシューティングを行いたいと考えています。
レプリケーション遅延は、プライマリインスタンスでの書き込み操作の間に遅延がある場合に発生します。データベース (DB) クラスター内の Aurora PostgreSQL 互換インスタンスは、レプリカの遅延を最小限に抑えてストレージボリュームを共有しますが、それでも遅延が発生する可能性があります。
レプリカの遅延を監視するには、「Aurora PostgreSQL レプリケーションのモニタリング」を参照してください。
アイドル状態のデータベース接続が大量に発生すると、パフォーマンスの問題やリソースの枯渇が発生する可能性があります。
これらの問題を解決するには、実行速度が遅いクエリを特定してトラブルシューティングしてください。
Aurora の PostgreSQL 互換における自動フェイルオーバーメカニズムは高可用性を優先するため、特定のインスタンス設定を保持しない場合があります。フェイルオーバーイベントの後、リーダーインスタンスとライターインスタンスのインスタンスクラスが入れ替わることがあります。
フェイルオーバーイベントを確認するには、次の手順を実行します。
Amazon RDS コンソールで現在のプライマリインスタンスを特定して、そのインスタンスのインスタンスクラスが入れ替わり、現在はライターインスタンスになっているかどうかを確認します。
設定を復元するには、フェイルオーバーを手動で開始する必要があります。
次の手順を実行します。
今後発生するフェイルオーバー後の設定上の問題を防ぐには、次の 1 つ以上の操作を実行してください。
別のフェイルオーバーソリューションについては、「How a large financial AWS customer implemented high availability and fast disaster recovery for Amazon Aurora PostgreSQL using Global Database and Amazon RDS Proxy」(金融業界大手の AWS のお客様が Global Database と Amazon RDS Proxy を使用して Amazon Aurora PostgreSQL の高可用性と迅速なディザスタリカバリを実装した方法) を参照してください。
Aurora PostgreSQL 互換の読み取り可用性機能を使用すると、ライターインスタンスに問題が発生したときの読み取り可用性が向上します。この機能は、Aurora PostgreSQL のバージョン 16.1 以降、15.2 以降、14.7 以降、13.10 以降、および 12.14 以降でデフォルトで使用できます。
詳細については、「Aurora レプリカの読み取り可用性の向上」を参照してください。
Amazon Aurora PostgreSQL を使用する際のベストプラクティス
Amazon Aurora の高可用性
Aurora PostgreSQL の待機イベントでのチューニング
Amazon RDS での Performance Insights を使用した DB 負荷のモニタリング