我想判斷是什麼原因導致我的 Amazon Aurora PostgreSQL 相容版本資料庫執行個體意外重新啟動或發生容錯移轉,並防止未來再次發生。
Aurora PostgreSQL 相容版資料庫執行個體發生非預期重新啟動,可能是因硬體故障、高資源使用率、複寫延遲或軟體問題造成的。
請完成以下步驟:
如需更多資訊,請參閱檢視 Amazon RDS 事件和使用 Amazon RDS 事件通知。
如需更多資訊,請參閱使用 Amazon CloudWatch 監控 Amazon Aurora 指標。
如需更多資訊,請參閱使用 CloudWatch Database Insights 監控 Amazon Aurora 資料庫。
如果您懷疑發生硬體故障,請聯絡 AWS Support 以疑難排解問題。AWS Support 可以檢查是否為主機層級問題導致重新啟動。
如需更多關於 Aurora PostgreSQL 資料庫日誌檔案的資訊,請參閱 Aurora PostgreSQL 資料庫日誌檔案。
設定 CloudWatch 警示以監控關鍵指標,例如 CPU 使用率、記憶體使用量和複寫延遲。
採取以下動作:
如果持續出現高資源使用率,請升級您的執行個體類型或新增 Aurora 複本。
為解決錯誤並提升效能,請定期套用修補程式與版本升級。
對於單一執行個體,請使用多可用區域資料庫執行個體部署。對於 Aurora 叢集,請確保至少有一個讀取器執行個體,讓 Aurora 在寫入器執行個體發生問題時可以提升該執行個體。
如需更多資訊,請參閱 Amazon Aurora 的高可用性。
Amazon Aurora 的監控工具
我該如何對導致 Aurora 讀取複本發生延遲並重新啟動的問題進行疑難排解?
使用 Amazon Aurora PostgreSQL 快速容錯移轉