

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Verwendung einer hybriden Migrationslösung: Apache Cassandra zu Amazon Keyspaces
<a name="migrating-hybrid"></a>

Die folgende Migrationslösung kann als Hybrid zwischen Online- und Offline-Migration betrachtet werden. Bei diesem hybriden Ansatz werden Daten nahezu in Echtzeit in die Zieldatenbank geschrieben, ohne dass eine Konsistenz beim Lesen nach dem Schreiben gewährleistet ist. Das bedeutet, dass neu geschriebene Daten nicht sofort verfügbar sind und Verzögerungen zu erwarten sind. Wenn Sie Konsistenz beim Lesen nach dem Schreiben benötigen, finden Sie weitere Informationen unter[Online-Migration zu Amazon Keyspaces: Strategien und bewährte Methoden](migrating-online.md). 

Für eine Migration von Apache Cassandra zu Amazon Keyspaces nahezu in Echtzeit können Sie zwischen zwei verfügbaren Methoden wählen.
+ **CQLReplicator**— (Empfohlen) CQLReplicator ist ein auf [Github](https://github.com/aws-samples/cql-replicator) verfügbares Open-Source-Hilfsprogramm, mit dem Sie Daten nahezu in Echtzeit von Apache Cassandra zu Amazon Keyspaces migrieren können.

  Um zu ermitteln, welche Schreibvorgänge und Aktualisierungen an die Zieldatenbank weitergegeben werden sollen, CQLReplicator scannt es den Apache Cassandra-Tokenbereich und verwendet einen AWS Glue Job, um doppelte Ereignisse zu entfernen und Schreibvorgänge und Aktualisierungen direkt auf Amazon Keyspaces anzuwenden.
+ **Change Data Capture (CDC)** — Wenn Sie mit Cassandra CDC vertraut sind, ist die in Apache Cassandra integrierte CDC-Funktion, mit der Änderungen erfasst werden können, indem das Commit-Protokoll in ein separates CDC-Verzeichnis kopiert wird, eine weitere Option für die Implementierung einer Hybridmigration.

  Sie können dies tun, indem Sie die Datenänderungen auf Amazon Keyspaces replizieren, wodurch CDC zu einer alternativen Option für Datenmigrationsszenarien wird. 

Wenn Sie keine Konsistenz beim Lesen nach dem Schreiben benötigen, können Sie entweder die CQLReplicator oder eine CDC-Pipeline verwenden, um Daten von Apache Cassandra zu Amazon Keyspaces zu migrieren, je nach Ihren Präferenzen und Ihrer Vertrautheit mit den Tools, die in den einzelnen Lösungen AWS-Services verwendet werden. Die Verwendung dieser Methoden zur Migration von Daten nahezu in Echtzeit kann als hybrider Migrationsansatz betrachtet werden, der eine Alternative zur Online-Migration bietet.

Diese Strategie wird als hybrider Ansatz betrachtet, da Sie zusätzlich zu den in diesem Thema beschriebenen Optionen einige Schritte der Online-Migration implementieren müssen, z. B. das Kopieren historischer Daten und die im Thema [Online-Migration erörterten Strategien zur Anwendungsmigration](migrating-online.md). 

In den folgenden Abschnitten werden die Optionen für die Hybridmigration ausführlicher behandelt.

**Topics**
+ [Migrieren Sie Daten mit CQLReplicator](migration-hybrid-cql-rep.md)
+ [Migrieren Sie Daten mithilfe von Change Data Capture (CDC)](migration-hybrid-cdc.md)

# Migrieren Sie Daten mit CQLReplicator
<a name="migration-hybrid-cql-rep"></a>

Mit [CQLReplicator](https://github.com/aws-samples/cql-replicator)können Sie Daten aus Apache Cassandra nahezu in Echtzeit lesen, indem Sie den Cassandra-Tokenring mithilfe von CQL-Abfragen intelligent scannen. CQLReplicator verwendet Cassandra CDC nicht und implementiert stattdessen eine Caching-Strategie, um die Leistungseinbußen bei vollständigen Scans zu reduzieren. 

Um die Anzahl der Schreibvorgänge auf das Ziel zu reduzieren, CQLReplicator werden doppelte Replikationsereignisse automatisch entfernt. Mit CQLReplicator können Sie die Replikation von Änderungen von der Quelldatenbank zur Zieldatenbank optimieren und so eine Migration von Daten von Apache Cassandra zu Amazon Keyspaces nahezu in Echtzeit ermöglichen. 

Das folgende Diagramm zeigt die typische Architektur eines CQLReplicator Jobs mit. AWS Glue 

1. **Um den Zugriff auf Apache Cassandra zu ermöglichen, das in einer privaten VPC ausgeführt wird, konfigurieren Sie eine AWS Glue Verbindung mit dem Verbindungstyp Netzwerk.**

1. Um Duplikate zu entfernen und das Schlüssel-Caching für den CQLReplicator Job zu aktivieren, konfigurieren Sie Amazon Simple Storage Service (Amazon S3).

1. Der CQLReplicator Job streamt verifizierte Quelldatenbankänderungen direkt an Amazon Keyspaces.

![\[Wird verwendet CQLReplicator , um Daten von Apache Cassandra zu Amazon Keyspaces zu migrieren.\]](http://docs.aws.amazon.com/de_de/keyspaces/latest/devguide/images/migration/hybrid-migration-CQLRep.png)


Weitere Informationen zum Migrationsprozess finden Sie im folgenden Beitrag im AWS Datenbank-Blog [Migrieren von Cassandra-Workloads zu Amazon Keyspaces using CQLReplicator](https://aws.amazon.com/blogs/database/migrate-cassandra-workloads-to-amazon-keyspaces-using-cqlreplicator/) und in der AWS präskriptiven Anleitung [Migrieren Sie Apache Cassandra-Workloads](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/migrate-apache-cassandra-workloads-to-amazon-keyspaces-using-aws-glue.html) zu Amazon Keyspaces mithilfe von. CQLReplicator AWS Glue

# Migrieren Sie Daten mithilfe von Change Data Capture (CDC)
<a name="migration-hybrid-cdc"></a>

Wenn Sie bereits mit der Konfiguration einer Change Data Capture (CDC) -Pipeline mit [Debezium](https://debezium.io/) vertraut sind, können Sie diese Option als Alternative zur Verwendung verwenden, um Daten zu Amazon Keyspaces zu migrieren. CQLReplicator Debezium ist eine verteilte Open-Source-Plattform für CDC, die entwickelt wurde, um eine Datenbank zu überwachen und Änderungen auf Zeilenebene zuverlässig zu erfassen. 

Der [Debezium-Konnektor für Apache Cassandra](https://debezium.io/documentation/reference/stable/connectors/cassandra.html) lädt Änderungen in Amazon Managed Streaming for Apache Kafka (Amazon MSK) hoch, sodass sie von nachgeschalteten Verbrauchern genutzt und verarbeitet werden können, die wiederum die Daten in Amazon Keyspaces schreiben. Weitere Informationen finden Sie unter [Anleitung für die kontinuierliche Datenmigration von Apache Cassandra zu Amazon Keyspaces](https://aws.amazon.com/solutions/guidance/continuous-data-migration-from-apache-cassandra-to-amazon-keyspaces/).

Um mögliche Probleme mit der Datenkonsistenz zu beheben, können Sie mit Amazon MSK einen Prozess implementieren, bei dem ein Verbraucher die Schlüssel oder Partitionen in Cassandra mit denen in Amazon Keyspaces vergleicht.

Um diese Lösung erfolgreich zu implementieren, empfehlen wir, Folgendes zu berücksichtigen. 
+ Wie man das CDC-Commit-Protokoll analysiert, zum Beispiel wie man doppelte Ereignisse entfernt.
+ Wie man das CDC-Verzeichnis verwaltet, zum Beispiel wie man alte Logs löscht.
+ Wie man mit Teilausfällen in Apache Cassandra umgeht, zum Beispiel wenn ein Schreibvorgang nur in einem von drei Replikaten erfolgreich ist.
+ Wie geht man mit der Ressourcenzuweisung um, indem man beispielsweise die Größe der Instanz erhöht, um zusätzliche CPU-, Arbeitsspeicher-, FESTPLATTEN- und I/O-Anforderungen für den CDC-Prozess zu berücksichtigen, der auf einem Knoten stattfindet.

Dieses Muster behandelt Änderungen von Cassandra als „Hinweis“, dass sich ein Schlüssel möglicherweise gegenüber seinem vorherigen Zustand geändert hat. Um festzustellen, ob es Änderungen gibt, die an die Zieldatenbank weitergegeben werden müssen, müssen Sie zuerst aus dem Cassandra-Quellcluster lesen, indem Sie eine `LOCAL_QUORUM` Operation verwenden, um die neuesten Datensätze zu empfangen, und sie dann in Amazon Keyspaces schreiben. 

Bei Bereichslöschungen oder Bereichsupdates müssen Sie möglicherweise einen Vergleich mit der gesamten Partition durchführen, um festzustellen, welche Schreib- oder Aktualisierungsereignisse in Ihre Zieldatenbank geschrieben werden müssen. 

In Fällen, in denen Schreibvorgänge nicht idempotent sind, müssen Sie Ihre Schreibvorgänge auch mit dem vergleichen, was sich bereits in der Zieldatenbank befindet, bevor Sie in Amazon Keyspaces schreiben.

Das folgende Diagramm zeigt die typische Architektur einer CDC-Pipeline mit Debezium und Amazon MSK. 

![\[Verwendung einer Change Data Capture-Pipeline zur Migration von Daten von Apache Cassandra zu Amazon Keyspaces.\]](http://docs.aws.amazon.com/de_de/keyspaces/latest/devguide/images/migration/hybrid-migration-CDC.png)
