步驟 1:使用建立資料上傳的來源CSV檔案和目標資料表 DSBulk - Amazon Keyspaces (適用於 Apache Cassandra)

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

步驟 1:使用建立資料上傳的來源CSV檔案和目標資料表 DSBulk

在本自學課程中,我們使用逗號分隔值 (CSV) 檔案,其名稱keyspaces_sample_table.csv做為資料移轉的來源檔案。提供的範例檔案包含名稱為資料表的幾列資料book_awards

  1. 建立來源檔案。您可以選擇以下其中一個選項:

    • 下載下列封存CSV檔案 samplemigration.zip 中包含的範例檔案 (keyspaces_sample_table.csv)。解壓縮封存並記下的路徑。keyspaces_sample_table.csv

    • 要使用存儲在 Apache 卡桑德拉數據庫中自己的數據填充文件,可以通過使用如下面的dsbulk unload例子填充源CSV文件。CSV

      dsbulk unload -k mykeyspace -t mytable -f ./my_application.conf > keyspaces_sample_table.csv

      請確定您建立的CSV檔案符合下列需求:

      • 第一列包含欄名稱。

      • 來源CSV檔案中的欄名稱與目標資料表中的欄名稱相符。

      • 資料會以逗號分隔。

      • 所有資料值都是有效的 Amazon Keyspaces 資料類型。請參閱 資料類型

  2. 在 Amazon 密鑰空間中創建目標 Keyspaces 間和表。

    1. 使用 Connect 到 Amazon 密 Keyspacescqlsh,並將下列範例中的服務端點、使用者名稱和密碼取代為您自己的值。

      cqlsh cassandra.us-east-2.amazonaws.com 9142 -u "111122223333" -p "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY" --ssl
    2. 使用名稱catalog創建一個新的密鑰空間,如下面的例子。

      CREATE KEYSPACE catalog WITH REPLICATION = {'class': 'SingleRegionStrategy'};
    3. 新的密鑰空間狀態為可用之後,請使用下列程式碼來建立目標資料表book_awards。若要進一步瞭解非同步資源建立以及如何檢查資源是否可用,請參閱檢查 Amazon 密鑰空間中的 Keyspaces 間創建狀態

      CREATE TABLE catalog.book_awards ( year int, award text, rank int, category text, book_title text, author text, publisher text, PRIMARY KEY ((year, award), category, rank) );

    如果 Apache 卡桑德拉是您的原始數據源,創建具有匹配標題 Amazon Keyspaces 目標表的簡單方法是從源表中生成的CREATE TABLE語句,如下面的語句。

    cqlsh localhost 9042 -u "username" -p "password" --execute "DESCRIBE TABLE mykeyspace.mytable;"

    然後使用與 Cassandra 源表中的描述相匹配的列名和數據類型在 Amazon Keyspaces 中創建目標表。