教學課程:使用將資料載入 Amazon Keyspaces DSBulk - Amazon Keyspaces (適用於 Apache Cassandra)

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

教學課程:使用將資料載入 Amazon Keyspaces DSBulk

本 step-by-step 教程指導您完成從 Apache 卡桑德拉數據遷移到 Amazon Keyspaces 使用 DataStax 批量加載器(DSBulk)可用。GitHub使用對DSBulk於將資料集上傳到 Amazon Keyspaces 以用於學術或測試目的非常有用。如需如何移轉生產工作負載的詳細資訊,請參閱離線遷移程序:將 Apache Cassandra 遷移至 Amazon Keyspaces。在此自學課程中,您將完成下列步驟。

先決條件 — 設定 AWS 使用認證帳戶、建立憑證的JKS信任存放區檔案、設定cqlsh、下載和安裝DSBulk,以及設定application.conf檔案。

  1. 建立來源CSV和目標資料表 — 準備CSV檔案做為來源資料,並在 Amazon 金鑰空間中建立目標 Keyspaces 間和表格。

  2. 準備資料 — 隨機化CSV檔案中的資料並對其進行分析,以決定平均和最大列大小。

  3. 設定輸送量容量 — 根據資料大小和所需的載入時間計算所需的寫入容量單位 (WCUs),並設定表格的佈建容量。

  4. DSBulk配置DSBulk設定 — 使用身份驗證、SSL/TLS、一致性層級和連線池大小等設定建立配置檔案。

  5. 執行DSBulk載入命令 — 執行 DSBulk load 命令,將CSV檔案中的資料上傳到 Amazon Keyspaces 表格,並監控進度。