本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
本教程将指导您完成使用 cqlsh COPY FROM
命令将数据从 Apache Cassandra 迁移到 Amazon Keyspaces 的过程。cqlsh COPY FROM
命令对于出于学术或测试目的快速轻松地将小型数据集上传到 Amazon Keyspaces 而言非常有用。有关如何迁移生产工作负载的更多信息,请参阅离线迁移过程:Apache Cassandra 到 Amazon Keyspaces。在本教程中,您将完成以下步骤:
先决条件 - 使用凭证设置 AWS 账户,为凭证创建 JKS 信任库文件,然后配置 cqlsh
以连接到 Amazon Keyspaces。
创建源 CSV 和目标表 - 准备一个 CSV 文件作为源数据,然后在 Amazon Keyspaces 中创建目标键空间和表。
准备数据 - 随机采样 CSV 文件中的数据,并对其进行分析,以确定平均行大小和最大行大小。
设置吞吐能力 - 根据数据大小和所需的加载时间计算所需的写入容量单位数(WCU),并配置表的预置容量。
配置 cqlsh 参数 - 确定诸如
INGESTRATE
、NUMPROCESSES
、MAXBATCHSIZE
和CHUNKSIZE
之类的cqlsh COPY FROM
参数的最佳值,以均匀分配工作负载。运行
cqlsh COPY FROM
命令 - 运行cqlsh COPY FROM
命令,将 CSV 文件中的数据上传到 Amazon Keyspaces 表,并监控进度。
疑难解答 - 解决数据上传过程中出现的常见问题,例如无效请求、解析器错误、容量错误和 cqlsh 错误。