选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

教程:使用 DSBulk 将数据加载到 Amazon Keyspaces

聚焦模式
教程:使用 DSBulk 将数据加载到 Amazon Keyspaces - Amazon Keyspaces(Apache Cassandra 兼容)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本分步教程将指导您使用 GitHub 上提供的 DataStax Bulk Loader (DSBulk) 将数据从 Apache Cassandra 迁移到 Amazon Keyspaces。如果要出于学术或测试目的将数据集上传到 Amazon Keyspaces,使用 DSBulk 将非常有用。有关如何迁移生产工作负载的更多信息,请参阅离线迁移过程:Apache Cassandra 到 Amazon Keyspaces。在本教程中,您将完成以下步骤。

先决条件 - 使用凭证设置 AWS 帐户、为凭证创建 JKS 信任库文件、配置 cqlsh、下载并安装 DSBulk,以及配置 application.conf 文件。

  1. 创建源 CSV 和目标表 - 准备一个 CSV 文件作为源数据,然后在 Amazon Keyspaces 中创建目标键空间和表。

  2. 准备数据 - 随机采样 CSV 文件中的数据,并对其进行分析,以确定平均行大小和最大行大小。

  3. 设置吞吐能力 - 根据数据大小和所需的加载时间计算所需的写入容量单位数(WCU),并配置表的预置容量。

  4. 配置 DSBulk 设置 - 使用身份验证、SSL/TLS、一致性级别和连接池大小等设置创建 DSBulk 配置文件。

  5. 运行 DSBulk 加载命令 – 运行 DSBulk 加载命令,将 CSV 文件中的数据上传到 Amazon Keyspaces 表,并监控进度。

下一主题:

先决条件

上一主题:

故障排除
隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。