如何解決將資料從 DynamoDB 移至 S3 時發生的 "Exception in thread "main" java.lang.RuntimeException: Read throughput should not be less than 1" 錯誤?

1 分的閱讀內容
0

我建立了一個 AWS Data Pipeline,以將資料從 Amazon DynamoDB 匯出到 Amazon Simple Storage Service (Amazon S3)。當我嘗試匯出資料時,收到 "Exception in thread "main" java.lang.RuntimeException: Read throughput should not be less than 1" 錯誤。

解決方法

如果要建立新管道以從 DynamoDB 表匯出資料,請使用將 DynamoDB 表匯出至 S3 資料管道範本建立管道。如需有關建立管道的詳細資訊,請參閱第二部分: 從 DynamoDB 匯出資料

如果使用現有管道將資料從 DynamoDB 匯出至 S3,則必須對管道使用最新 EMR DynamoDB 連接器。當您使用舊版 EMR DynamoDB 連接器匯出資料時,可能會出現錯誤。

請確定 DynamoDB 表的 Amazon EMR 版本為 5.24.0 或更新版本。只有在使用 Amazon EMR 版本 5.24.0 或更新版本時,才支援針對隨需容量設定的 DynamoDB 表。如需詳細資訊,請參閱從 DynamoDB 匯出資料 - 開始之前

若要更新現有管道以使用最新的 EMR-DynamoDB 連接器和 Amazon EMR 5.24.0 或更新版本,請執行下列操作:

1.    開啟 AWS Data Pipeline 主控台

2.    選取管道,然後選擇動作

3.    選擇編輯

4.    在左窗格中選擇 EmrActivity

5.    展開活動窗格,然後尋找 EMRActivity 物件。

6.    在步驟欄位中,輸入下列 JAR 名稱:

s3://dynamodb-dpl-#{myDDBRegion}/emr-ddb-storage-handler/4.11.0/emr-dynamodb-tools-4.11.0-SNAPSHOT-jar-with-dependencies.jar

7.    在左窗格中選擇 EmrCluster

8.    展開資源窗格。

9.    為發行標籤輸入 emr-5.24.0 或任何更新的 EMR 發行版本。

10.    選擇儲存


相關資訊

如何使用資料管道將 DynamoDB 表備份到不同帳戶中的 S3 儲存貯體?

AWS 官方
AWS 官方已更新 1 年前