기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
장애 복구
해당 AWS 리전의 서비스 이벤트가 종료된 후 기본 리전으로 페일백할 수 있습니다.
- Identical topic name replication
-
보조 클러스터를 소스로, 기본 클러스터를 대상으로 하여 새 MSK Replicator를 생성합니다. 시작 위치는 가장 빠른 동일한 주제 이름 복제로 설정됩니다(콘솔에서 동일한 주제 이름 유지). 이렇게 하면 기본 리전으로 장애 조치 후 보조 클러스터에 기록된 모든 데이터가 복사되기 시작합니다.
Amazon CloudWatch에서 새로운 Replicator의
MessageLag지표가0에 도달할 때까지 모니터링합니다. 이 도달은 모든 데이터가 보조에서 기본으로 복제되었음을 나타냅니다.모든 데이터가 복제되면 보조 클러스터에 연결하는 모든 생산자를 중지하고 기본 클러스터에 연결하는 생산자를 시작합니다.
보조 클러스터에 연결하는 소비자가 모든 데이터를 처리했는지 확인하기
0위해MaxOffsetLag지표가 될 때까지 기다립니다. 소비자 지연 모니터링을(를) 참조하세요.모든 데이터가 처리되면 보조 리전의 소비자를 중지하고 기본 클러스터에 연결하여 장애 복구를 완료합니다.
보조 클러스터에서 기본 클러스터로 데이터를 복제하는 첫 번째 단계에서 생성한 Replicator를 삭제합니다.
기본 클러스터에서 보조 클러스터로 데이터를 복사하는 기존 Replicator의 상태가 "RUNNING"이고 Amazon CloudWatch의
ReplicatorThroughput지표가 보다 큰지 확인합니다0.시작 위치가 가장 빠른 장애 복구인 새 Replicator를 생성하면 보조 클러스터의 주제에 있는 모든 데이터를 읽기 시작합니다. 데이터 보존 설정에 따라 소스 클러스터에서 가져온 데이터가 주제에 있을 수 있습니다. MSK Replicator에서 이러한 메시지를 자동으로 필터링하지만 보조 클러스터의 모든 데이터에 대한 데이터 처리 및 전송 요금이 계속 발생합니다.
ReplicatorBytesInPerSec를 사용하여 Replicator에서 처리한 총 데이터를 추적할 수 있습니다.
- Prefixed topic name replication
-
보조 리전의 클러스터에서 기본 리전의 클러스터로 복제한 후에만 장애 복구 단계를 시작해야 하며 Amazon CloudWatch의
MessageLag지표는 0에 가깝습니다. 계획된 페일백으로 인해 데이터가 손실되어서는 안 됩니다.보조 리전의 MSK 클러스터에 연결하는 모든 생산자와 소비자를 종료합니다.
액티브-패시브 토폴로지의 경우 보조 리전의 클러스터에서 기본 리전으로 데이터를 복제하는 복제기를 삭제합니다. 액티브-액티브 토폴로지의 경우에는 복제기를 삭제할 필요가 없습니다.
기본 리전의 MSK 클러스터에 연결하는 생산자를 시작합니다.
애플리케이션에 메시지 순서 지정이 필요하지 않은 경우 와일드카드 연산자를 사용하여 로컬 주제와 복제된 주제 모두에서 읽는 기본 AWS 리전에서 소비자를 시작합니다. 애플리케이션에 메시지 순서 지정이 필요한 경우 먼저 복제된 주제에 대해서만 소비자를 시작하고 지연이 0에 도달할 때까지 기다린 다음 로컬 주제로 전환합니다.
기본 리전의 클러스터에서 보조 리전의 클러스터로 기존 Replicator가 실행 중 상태이고
ReplicatorThroughput및 지연 시간 지표를 사용하여 예상대로 작동하는지 확인합니다.