翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Debezium
Apache Cassandra 用 Debezium コネクタ
潜在的なデータ整合性の問題に対処するために、コンシューマーMSKが Cassandra のキーまたはパーティションを Amazon Keyspaces のキーまたはパーティションと比較するプロセスを Amazon で実装できます。
このソリューションを問題なく実装できるように、次の点を検討することをお勧めします。
CDC コミットログを解析する方法。たとえば、重複するイベントを削除する方法などです。
古いログを削除する方法など、CDCディレクトリを維持する方法。
Apache Cassandra で部分的な障害に対処する方法 (例えば、書き込みが 3 つのレプリカの 1 つでのみ成功した場合など)。
ノードで発生するCDCプロセスの追加の CPU、メモリ、、および IO 要件を考慮してインスタンスのサイズを増やすなどDISK、リソース割り当てを処理する方法。
このパターンでは、Cassandra からの変更を、キーが以前の状態から変更された可能性があるという「ヒント」として扱います。宛先データベースに伝達すべき変更があるかを判断するには、まずソースとなる Cassandra クラスターから LOCAL_QUORUM
オペレーションを使用して最新のレコードを取得する必要があり、その後、そのレコードを Amazon Keyspaces に書き込みます。
範囲指定の削除や更新の場合、パーティション全体との比較を実行しないと、宛先データベースに書き込む必要がある書き込みイベントや更新イベントを判断できない可能性があります。
書き込みがべき等でない場合は、Amazon Keyspaces に書き込む前に、書き込み内容を宛先データベースの既存データと比較する必要も生じます。
次の図は、Debezium と Amazon を使用するCDCパイプラインの一般的なアーキテクチャを示していますMSK。
![変更データキャプチャパイプラインを使用して、Apache Cassandra から Amazon Keyspaces にデータを移行します。](images/migration/hybrid-migration-CDC.png)