跳至內容

如何對 OpenSearch Service 中卡住或失敗的升級進行疑難排解?

1 分的閱讀內容
0

我的 Amazon OpenSearch Service 網域卡住或無法完成升級流程。

簡短說明

OpenSearch Service 使用藍/綠部署程序進行網域升級。在此程序中,碎片重新定位的問題可能會導致網域卡在修改中狀態。或者,網域的升級驗證檢查可能會失敗。

**注意:**啟動升級後將無法取消。如果升級卡住,必須等待 AWS 解決底層問題後,才能完成程序。

解決方法

網域在碎片重新定位期間卡在「修改中」狀態

在藍/綠部署期間,OpenSearch Service 會將現有節點的資料複製到新節點。如果碎片在重新定位程序中卡住,則網域將保持在修改中狀態。

此問題可能發生的原因如下:

  • 大型碎片超過 50 GB 會增加碎片複製時間。
  • 索引或搜尋負載導致叢集資源使用率過高。
  • 磁碟空間不足以將碎片複製到新節點。
  • 您已達到碎片數量配額上限

若要對這些問題進行疑難排解,請使用 Amazon CloudWatch 查看 FreeStorageSpaceClusterStatusClusterIndexWritesBlocked OpenSearch Service 指標,檢查是否有磁碟空間問題或叢集負載過高。

根據您找出的問題,採取以下操作:

如需更多如何刪除索引的資訊,請參閱 OpenSearch 網站上的 DeleteIndex刪除索引 API

若要監控碎片遷移程序,請執行以下命令:

GET _cat/recovery?active_only=true

命令輸出會顯示使用中碎片恢復狀態、進度百分比、恢復時間、失敗狀態及資料傳輸大小。如果碎片沒有進度或收到空輸出,則升級程序可能存在問題。若要對升級問題進行疑難排解,請建立 AWS Support 案例

如果您的碎片大小超過 50 GB,請重新索引資料以建立更小的碎片。如需操作說明,請參閱 OpenSearch 網站上的重新索引資料

如果上述疑難排解操作仍無法解決問題,則建立 AWS Support 案例

網域的升級驗證檢查失敗

在升級過程中,OpenSearch Service 會驗證您的網域組態是否與新版本相容。如果驗證失敗,網域將卡在修改中狀態。

若要解決此問題,請檢查網域描述中有關失敗活動或驗證相關錯誤訊息。完成針對錯誤的疑難排解步驟,然後重新嘗試變更組態。

預防升級問題的最佳實務

請執行下列操作:

相關資訊

為什麼我的 OpenSearch Service 網域卡在「修改中」狀態?

AWS 官方已更新 2 個月前