本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
以下迁移解决方案可以被视为在线和离线迁移的混合体。使用这种混合迁移方法,可以近乎实时地将数据写入目标数据库,而无需提供写后读一致性。这意味着新写入的数据不会立即可用,会出现延迟。如果您需要写后读一致性,请参阅在线迁移到 Amazon Keyspaces:策略和最佳实践。
要实现近乎实时地从 Apache Cassandra 迁移到 Amazon Keyspaces,您可以在两种可用方法之间进行选择。
CQLReplicator—(推荐)CQLReplicator是 Github
上提供的开源实用程序,可帮助您近乎实时地将数据从 Apache Cassandra 迁移到 Amazon Keyspaces。 要确定要传播到目标数据库的写入和更新,请CQLReplicator扫描 Apache Cassandra 令牌范围,然后使用 AWS Glue 任务删除重复的事件,并将写入和更新直接应用于 Amazon Keyspaces。
更改数据捕获 (CDC) — 如果您熟悉 CassandraCDC,那么实现混合迁移的另一种选择是 Apache Cassandra 内置CDC功能,该功能允许通过将提交日志复制到单独的CDC目录来捕获更改。
为此,您可以将数据更改复制到 Amazon Keyspaces,CDC为数据迁移场景提供替代选项。
如果您不需要在写入后读取一致性,则可以根据您的偏好和对工具的熟悉程度使用CQLReplicator或CDC管道将数据从 Apache Cassandra 迁移到 Amazon Keyspaces,并在每个解决方案中使用。 AWS 服务 使用这些方法近乎实时地迁移数据可以被视为一种混合迁移方法,其提供了在线迁移的替代方案。
此策略被视为一种混合方法,因为除了本主题中概述的选项外,您还必须执行在线迁移进度中的某些步骤,例如在线迁移主题中讨论的历史数据复制和应用程序迁移策略。
以下各节更详细地说明了混合迁移选项。