

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 변경 데이터 캡처(CDC)를 사용하여 데이터 마이그레이션
<a name="migration-hybrid-cdc"></a>

[Debezium](https://debezium.io/)을 사용하여 변경 데이터 캡처(CDC) 파이프라인을 구성하는 데 이미 익숙한 경우 이 옵션을 사용하여 CQLReplicator를 사용하는 대신 Amazon Keyspaces로 데이터를 마이그레이션할 수 있습니다. Debezium은 데이터베이스를 모니터링하고 행 수준 변경 사항을 안정적으로 캡처하도록 설계된 CDC용 오픈 소스 분산 플랫폼입니다.

[Apache Cassandra용 Debezium 커넥터](https://debezium.io/documentation/reference/stable/connectors/cassandra.html)는 Amazon Managed Streaming for Apache Kafka(Amazon MSK)에 변경 사항을 업로드하여 다운스트림 소비자가 사용하고 처리할 수 있도록 하고, 이를 통해 Amazon Keyspaces에 데이터를 씁니다. 자세한 내용은 [Guidance for continuous data migration from Apache Cassandra to Amazon Keyspaces](https://aws.amazon.com/solutions/guidance/continuous-data-migration-from-apache-cassandra-to-amazon-keyspaces/)를 참조하세요.

잠재적인 데이터 일관성 문제를 해결하기 위해 소비자가 Cassandra의 키 또는 파티션을 Amazon Keyspaces의 키 또는 파티션과 비교하는 Amazon MSK 프로세스를 구현할 수 있습니다.

이 솔루션을 성공적으로 구현하려면 다음을 고려하는 것이 좋습니다.
+ 중복 이벤트를 제거하는 방법 등 CDC 커밋 로그를 구문 분석하는 방법.
+ CDC 디렉터리를 유지하는 방법(예: 이전 로그를 삭제하는 방법).
+ 예를 들어 쓰기가 복제본 3개 중 1개에서만 성공하는 경우 Apache Cassandra에서 부분 장애를 처리하는 방법.
+ 노드에서 발생하는 CDC 프로세스에 대한 추가 CPU, 메모리, DISK 및 IO 요구 사항을 고려하기 위해 인스턴스 크기를 늘리는 등 리소스 할당을 처리하는 방법.

이 패턴은 Cassandra의 변경 사항을 키가 이전 상태에서 변경되었을 수 있는 '힌트'로 취급합니다. 대상 데이터베이스에 전파할 변경 사항이 있는지 확인하려면 먼저 `LOCAL_QUORUM` 작업을 사용하여 원본 Cassandra 클러스터에서 최신 레코드를 받은 다음 Amazon Keyspaces에 기록해야 합니다.

범위 삭제 또는 범위 업데이트의 경우 전체 파티션과 비교하여 대상 데이터베이스에 작성할 쓰기 또는 업데이트 이벤트를 결정해야 할 수 있습니다.

쓰기가 멱등성이 아닌 경우 Amazon Keyspaces에 쓰기 전에 이미 대상 데이터베이스에 있는 것과 쓰기를 비교해야 합니다.

다음 다이어그램은 Debezium 및 Amazon MSK를 사용하는 CDC 파이프라인의 일반적인 아키텍처를 보여줍니다.

![\[변경 데이터 캡처 파이프라인을 사용하여 Apache Cassandra에서 Amazon Keyspaces로 데이터를 마이그레이션합니다.\]](http://docs.aws.amazon.com/ko_kr/keyspaces/latest/devguide/images/migration/hybrid-migration-CDC.png)
