本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
步驟 1:使用建立資料上傳的來源CSV檔案和目標資料表 DSBulk
在本自學課程中,我們使用逗號分隔值 (CSV) 檔案,其名稱keyspaces_sample_table.csv
做為資料移轉的來源檔案。提供的範例檔案包含名稱為資料表的幾列資料book_awards
。
建立來源檔案。您可以選擇以下其中一個選項:
-
下載下列封存CSV檔案 samplemigration.zip 中包含的範例檔案 (
keyspaces_sample_table.csv
)。解壓縮封存並記下的路徑。keyspaces_sample_table.csv
-
要使用存儲在 Apache 卡桑德拉數據庫中自己的數據填充文件,可以通過使用如下面的
dsbulk unload
例子填充源CSV文件。CSVdsbulk unload -k
mykeyspace
-tmytable
-f ./my_application.conf >keyspaces_sample_table.csv
請確定您建立的CSV檔案符合下列需求:
-
第一列包含欄名稱。
-
來源CSV檔案中的欄名稱與目標資料表中的欄名稱相符。
-
資料會以逗號分隔。
-
所有資料值都是有效的 Amazon Keyspaces 資料類型。請參閱 資料類型。
-
-
-
在 Amazon 密鑰空間中創建目標 Keyspaces 間和表。
使用 Connect 到 Amazon 密 Keyspaces
cqlsh
,並將下列範例中的服務端點、使用者名稱和密碼取代為您自己的值。cqlsh
cassandra.us-east-2.amazonaws.com
9142 -u"111122223333"
-p"wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY"
--ssl使用名稱
catalog
創建一個新的密鑰空間,如下面的例子。CREATE KEYSPACE
catalog
WITH REPLICATION = {'class': 'SingleRegionStrategy'};新的密鑰空間狀態為可用之後,請使用下列程式碼來建立目標資料表
book_awards
。若要進一步瞭解非同步資源建立以及如何檢查資源是否可用,請參閱檢查 Amazon 密鑰空間中的 Keyspaces 間創建狀態。CREATE TABLE
catalog.book_awards
( year int, award text, rank int, category text, book_title text, author text, publisher text, PRIMARY KEY ((year, award), category, rank) );
如果 Apache 卡桑德拉是您的原始數據源,創建具有匹配標題 Amazon Keyspaces 目標表的簡單方法是從源表中生成的
CREATE TABLE
語句,如下面的語句。cqlsh localhost 9042 -u "username" -p "password" --execute "DESCRIBE TABLE
mykeyspace.mytable
;"然後使用與 Cassandra 源表中的描述相匹配的列名和數據類型在 Amazon Keyspaces 中創建目標表。