如何在 Aurora 全球資料庫中執行容錯移轉,以及為什麼我的容錯移轉失敗?

1 分的閱讀內容
0

我想知道如何在 Amazon Aurora PostgreSQL 相容版全球資料庫中執行容錯移轉,以及容錯移轉失敗的原因。

解決方案

對於 Aurora 全球資料庫,有兩種不同的選項可用於執行容錯移轉:

  • 手動未計劃容錯移轉 (「卸離並升級」)-使用此選項可從意外中斷中復原或執行災難復原測試。
  • 受管規劃容錯移轉-使用此選項進行操作維護或其他規劃的操作程序。

手動未計劃容錯移轉

若要在主要 AWS 區域發生意外中斷後容錯移轉至次要叢集,請先執行下列動作:

  1. 停止在中斷的情況下向 AWS 區域中的主要 Aurora 資料庫叢集發出 DML 陳述式和其他寫入操作。
  2. 從次要 AWS 區域識別 Aurora 資料庫叢集,使用該叢集作為新的主要資料庫叢集。如果 Aurora 全球資料庫中有兩個或兩個以上的次要 AWS 區域,請選擇延遲時間最短的次要叢集。
  3. 從 Aurora 全球資料庫中移除選擇的次要資料庫叢集

然後,若要完成手動未計劃容錯移轉,請執行下列動作:

  1. 重新設定應用程式,使其使用新端點將所有寫入作業傳送至現在獨立的 Aurora DB 叢集。如果您在建立 Aurora 全球資料庫時接受提供的名稱,請從叢集的端點字串中移除 -ro 以變更端點。
    例如,當次要叢集從 Aurora 全球資料庫中分離時,該次要叢集的端點 my-global.cluster-ro-aabb.us-west-1.rds.amazonaws.com 會變成 my-global.cluster-aabb.us-west-1.rds.amazonaws.com
    當您開始向其新增區域時,次要 Aurora 資料庫叢集會成為新 Aurora 全球資料庫的主要叢集。
  2. 將 AWS 區域新增至資料庫叢集以啟動從主要叢集到次要叢集的複寫程序。
  3. 視需要新增更多 AWS 區域,以重新建立支援應用程式所需的拓撲。

如需詳細資訊,請參閱從意外中斷中復原 Amazon Aurora 全球資料庫

受管規劃容錯移轉

若要為 Aurora 全球資料庫啟動受管規劃容錯移轉,請執行下列動作:

  1. 開啟 Amazon RDS 主控台
  2. 選擇 Databases (資料庫),然後尋找您要容錯移轉的 Aurora 全球資料庫。
  3. 從「動作」功能表中選擇 Fail over global database (容錯移轉全域資料庫)。容錯移轉現在處於擱置中狀態,在您選擇容錯移轉目標之後,程序才會開始。
  4. 選擇您要升級為主要叢集的次要 Aurora 資料庫叢集。次要資料庫叢集必須可用
    注意:如果您有多個次要資料庫叢集,請比較所有次要資料庫的延遲量。然後,選擇延遲量最小的項目。
  5. 選擇 Fail over global database (容錯移轉全域資料庫) 以確認您選擇的次要資料庫叢集,然後開始容錯移轉程序。
    資料庫清單的狀態欄會顯示容錯移轉程序期間每個 Aurora 資料庫執行個體和 Aurora 資料庫叢集的狀態。
    控制台頂端的狀態列會顯示進度,並提供 Cancel failover (取消容錯移轉) 選項。
    如果您選擇 Cancel failover (取消容錯移轉),則系統會提供繼續進行容錯移轉或取消容錯移轉程序的選項。
  6. 選擇 Close (關閉) 以繼續容錯移轉,並關閉提示。

容錯移轉完成後,您可以在 Databases (資料庫) 清單中看到 Aurora DB 叢集及其目前的狀態。如需詳細資訊,請參閱針對 Amazon Aurora 全球資料庫執行受管的計劃容錯移轉

您也可以透過執行 failover-global-cluster 命令,使用 AWS Command Line Interface (AWS CLI) 啟動受管的計劃容錯移轉。

容錯移轉失敗的原因

容錯移轉可能會因為下列其中一個原因而失敗:

  • 來源與目標之間的複寫延遲
  • 可用區域失敗
  • 計算節點故障
  • 資料庫執行個體間的聯網
  • 儲存問題
  • 大型活動

相關資訊

在 Amazon Aurora 全球資料庫中使用容錯移轉

AWS 官方
AWS 官方已更新 1 年前