我需要規劃 Amazon EMR 升級,以跟上快速變化的技術步伐。
簡短描述
為了跟上大數據的快速變化,您必須升級 Amazon EMR 版本。移轉至新版 Amazon EMR 可改善卓越營運和工作負載的有效性。但是,在升級 Amazon EMR 之前,您必須進行規劃和準備。您必須檢閱某些資訊,以及必須遵循程序。
Amazon EMR 版本升級的優點
升級 Amazon EMR 的優點包括:
- 利用最新功能提高生產力並降低成本。
- 更新的應用程式執行更快速。
- 最新的錯誤修正提供穩定的基礎架構。
- 最新的安全修補程式可強化安全。
- 開放原始碼軟體功能的最新存取權。
例如,使用 Amazon EMR 6.6 版和更新版本,Log4j 1.x 和 Log4j 2.x 分別會升級為 Log4j 1.2.17 和 Log4j 2.17.1 (或更高版本)。在更高版本中,不需要啟動動作來緩解通用漏洞披露 (CVE)。
解決方案
適用於開放原始碼應用程式的 Amazon EMR 效能最佳化功能
Amazon EMR 為許多開放原始碼應用程式提供效能最佳化功能。
Spark:
Delta Lake:
Flink:
Hadoop:
HBase:
HCatalog:
Hive:
Hudi:
Iceberg:
Presto 和 Trino:
規劃 Amazon EMR 版本升級
請依照下列步驟準備 Amazon EMR 版本升級:
- 研究您在目前 Amazon EMR 版本中面臨的問題。
- 隔離您要用來測試 EMR 叢集效能的一小部分應用程式或查詢。
- 設定 A/B 測試策略,決定最適合您解決方案的 Amazon EMR 版本。在 Amazon EMR 的 A/B 測試中,您可以測試兩個不同版本的服務,以比較它們在環境中的效能。
- 逐步將工作負載移轉到新版本的 Amazon EMR。如果您在 Amazon EMR 的生產版本上發現重大問題,可以在此處結束移轉程序。
- 移轉完成之後,請終止舊的 Amazon EMR 叢集。
修正與 Amazon EMR 版本升級相關的問題
請依照下列步驟修正升級 Amazon EMR 版本時遇到的問題:
- 重新設定應用程式。觀察變更是否會改善應用程式的效能。
- 檢查問題是否已由較新版本的應用程式解決。
- 變更應用程式或查詢,看看是否可以避免問題。
- 檢查開放缺陷和因應措施,以改善應用程式。請聯絡 AWS Premium Support,了解是否有因應措施。
- 停止 Amazon EMR 移轉,直到問題解決或有因應措施為止。
Amazon EMR 版本升級的考量
升級 Amazon EMR 版本時,效能迴歸可能會造成問題。升級可能會變更 API,這可能會影響程式碼在較新介面上執行的能力。Amazon EMR 版本升級之後,可能會發生應用程式緩慢和失敗。
當您考慮升級 Amazon EMR 版本時,最佳實務是閱讀版本指南的最新消息?一節。最新消息?一節包括 Amazon EMR 發行版本和日期的相關資訊,以及開放原始碼應用程式常見問題的解決方案。
研究開放原始碼應用程式變更和未解決問題
在決定移轉至新的 Amazon EMR 版本之前,請檢查下列版本備註和開放瑕疵。下列應用程式清單是以 Amazon EMR 6.9 版為基礎。
**注意:**這些超連結會帶您前往第三方應用程式網站、GitHub 或 Apache 網站。