我的 Amazon OpenSearch Service 網域卡住或無法完成升級流程。
簡短說明
OpenSearch Service 使用藍/綠部署程序進行網域升級。在此程序中,碎片重新定位的問題可能會導致網域卡在修改中狀態。或者,網域的升級驗證檢查可能會失敗。
**注意:**啟動升級後將無法取消。如果升級卡住,必須等待 AWS 解決底層問題後,才能完成程序。
解決方法
網域在碎片重新定位期間卡在「修改中」狀態
在藍/綠部署期間,OpenSearch Service 會將現有節點的資料複製到新節點。如果碎片在重新定位程序中卡住,則網域將保持在修改中狀態。
此問題可能發生的原因如下:
- 大型碎片超過 50 GB 會增加碎片複製時間。
- 索引或搜尋負載導致叢集資源使用率過高。
- 磁碟空間不足以將碎片複製到新節點。
- 您已達到碎片數量配額上限。
若要對這些問題進行疑難排解,請使用 Amazon CloudWatch 查看 FreeStorageSpace、ClusterStatus 和 ClusterIndexWritesBlocked OpenSearch Service 指標,檢查是否有磁碟空間問題或叢集負載過高。
根據您找出的問題,採取以下操作:
如需更多如何刪除索引的資訊,請參閱 OpenSearch 網站上的 DeleteIndex 或刪除索引 API。
若要監控碎片遷移程序,請執行以下命令:
GET _cat/recovery?active_only=true
命令輸出會顯示使用中碎片恢復狀態、進度百分比、恢復時間、失敗狀態及資料傳輸大小。如果碎片沒有進度或收到空輸出,則升級程序可能存在問題。若要對升級問題進行疑難排解,請建立 AWS Support 案例。
如果您的碎片大小超過 50 GB,請重新索引資料以建立更小的碎片。如需操作說明,請參閱 OpenSearch 網站上的重新索引資料。
如果上述疑難排解操作仍無法解決問題,則建立 AWS Support 案例。
網域的升級驗證檢查失敗
在升級過程中,OpenSearch Service 會驗證您的網域組態是否與新版本相容。如果驗證失敗,網域將卡在修改中狀態。
若要解決此問題,請檢查網域描述中有關失敗活動或驗證相關錯誤訊息。完成針對錯誤的疑難排解步驟,然後重新嘗試變更組態。
預防升級問題的最佳實務
請執行下列操作:
相關資訊
為什麼我的 OpenSearch Service 網域卡在「修改中」狀態?