本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
教學課程:使用將資料載入 Amazon Keyspaces DSBulk
本 step-by-step 教程指導您完成從 Apache 卡桑德拉數據遷移到 Amazon Keyspaces 使用 DataStax 批量加載器(DSBulk)可用。GitHub
先決條件 — 設定 AWS 使用認證帳戶、建立憑證的JKS信任存放區檔案、設定cqlsh
、下載和安裝DSBulk,以及設定application.conf
檔案。
建立來源CSV和目標資料表 — 準備CSV檔案做為來源資料,並在 Amazon 金鑰空間中建立目標 Keyspaces 間和表格。
準備資料 — 隨機化CSV檔案中的資料並對其進行分析,以決定平均和最大列大小。
設定輸送量容量 — 根據資料大小和所需的載入時間計算所需的寫入容量單位 (WCUs),並設定表格的佈建容量。
DSBulk配置DSBulk設定 — 使用身份驗證、SSL/TLS、一致性層級和連線池大小等設定建立配置檔案。
執行DSBulk載入命令 — 執行 DSBulk load 命令,將CSV檔案中的資料上傳到 Amazon Keyspaces 表格,並監控進度。