本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
教程:使用 DSBulk 将数据加载到 Amazon Keyspaces
本分步教程将指导您使用上提供的 DataStax 批量加载器 (DSBulk) 将数据从 Apache Cassandra 迁移到亚马逊密钥空间。GitHub
先决条件-使用凭据设置 AWS 帐户,为证书创建 JKS 信任存储文件,配置cqlsh、下载和安装 DSBulk,以及配置文件。application.conf
创建源 CSV 和目标表 - 准备一个 CSV 文件作为源数据,然后在 Amazon Keyspaces 中创建目标键空间和表。
准备数据 - 随机采样 CSV 文件中的数据,并对其进行分析,以确定平均行大小和最大行大小。
设置吞吐能力 - 根据数据大小和所需的加载时间计算所需的写入容量单位数(WCU),并配置表的预置容量。
配置 DSBulk 设置-使用身份验证、 SSL/TLS一致性级别和连接池大小等设置创建 DSBulk 配置文件。
运行 DSBulk 加载命令 – 运行 DSBulk 加载命令,将 CSV 文件中的数据上传到 Amazon Keyspaces 表,并监控进度。