Amazon Aurora PostgreSQL 互換エディションデータベース (DB) インスタンスが予期せず再起動またはフェイルオーバーした原因を特定し、今後の発生を防ぎたいと考えています。
Aurora PostgreSQL 互換 DB インスタンスでの予期しない再起動は、ハードウェア障害、リソース使用率の高さ、レプリケーション遅延、またはソフトウェアの問題が原因で発生する可能性があります。
次の手順を実行します。
詳細については、「Amazon RDS イベントの表示」および「Amazon RDS イベント通知の操作」を参照してください。
詳細については、「Amazon CloudWatch を使用した Amazon Aurora メトリクスのモニタリング」を参照してください。
詳細については、「CloudWatch Database Insights による Amazon Aurora データベースのモニタリング」を参照してください。
ハードウェア障害が疑われる場合は、AWS サポートに連絡して問題のトラブルシューティングを行ってください。AWS サポートは、ホストレベルの問題が再起動を引き起こしたかどうかを確認できます。
Aurora PostgreSQL データベースログファイルの詳細については、「Aurora PostgreSQL データベースログファイル」を参照してください。
CPU 使用率、メモリ使用量、レプリケーション遅延などの重要なメトリクスに対して CloudWatch アラームを設定します。
次の操作を実行します。
リソース使用率が常に高い場合は、インスタンスタイプをスケールアップするか、Aurora レプリカを追加してください。
バグを解決してパフォーマンスを向上させるには、定期的にパッチを適用し、バージョンアップグレードを行ってください。
単一インスタンスの場合は、マルチ AZ DB インスタンスデプロイを使用してください。Aurora クラスターの場合、ライターインスタンスに問題が発生したときに Aurora が昇格させるリーダーインスタンスが 1 つ以上あることを確認してください。
詳細については、「Amazon Aurora の高可用性」を参照してください。
Amazon Aurora のモニタリングツール
Aurora リードレプリカが遅れて再起動する原因となる問題のトラブルシューティング方法を教えてください
Amazon Aurora PostgreSQL による高速フェイルオーバー