시스템 롤백 모범 사례 - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink는 이전에 Amazon Kinesis Data Analytics for Apache Flink로 알려졌습니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

시스템 롤백 모범 사례

Amazon Managed Service for Apache Flink의 자동 시스템 롤백 및 운영 가시성 기능을 사용하면 애플리케이션 문제를 식별하고 해결할 수 있습니다.

시스템 롤백

코드 버그 또는 권한 문제와 같은 고객 오류로 인해 애플리케이션 업데이트 또는 크기 조정 작업이 실패하는 경우 Amazon Managed Service for Apache Flink는 이 기능에 옵트인한 경우 자동으로 실행 중인 이전 버전으로 롤백을 시도합니다. 자세한 내용은 Managed Service for Apache Flink 애플리케이션에 대한 시스템 롤백 활성화 단원을 참조하십시오. 이 자동 롤백이 실패하거나 옵트인 또는 옵트아웃하지 않은 경우 애플리케이션이 READY 상태로 전환됩니다. 애플리케이션을 업데이트하려면 다음 단계를 완료하세요.

수동 롤백

애플리케이션이 진행 중이 아니고 오랫동안 일시적인 상태인 경우 또는 애플리케이션이 로 성공적으로 전환Running되었지만 성공적으로 업데이트된 Flink 애플리케이션에서 처리 오류와 같은 다운스트림 문제가 표시되는 경우 RollbackApplication 를 사용하여 수동으로 롤백할 수 있습니다API.

  1. 호출 RollbackApplication - 실행 중인 이전 버전으로 되돌리고 이전 상태를 복원합니다.

  2. 를 사용하여 롤백 작업을 모니터링합니다DescribeApplicationOperationAPI.

  3. 롤백에 실패하면 이전 시스템 롤백 단계를 사용합니다.

운영 가시성

는 애플리케이션의 모든 고객 및 시스템 작업 기록을 ListApplicationOperations API 보여줍니다.

  1. 목록에서 실패한 작업operationId의 를 가져옵니다.

  2. 및 를 호출DescribeApplicationOperation하여 상태를 확인합니다statusDescription.

  3. 작업이 실패하면 설명이 조사할 잠재적 오류를 가리킵니다.

일반적인 오류 코드 버그: 롤백 기능을 사용하여 마지막 작업 버전으로 되돌립니다. 버그를 해결하고 업데이트를 다시 시도합니다.

권한 문제: DescribeApplicationOperation 를 사용하여 필요한 권한을 확인합니다. 애플리케이션 권한을 업데이트하고 다시 시도합니다.

Amazon Managed Service for Apache Flink 서비스 문제: 를 확인하거나 지원 사례를 AWS Health Dashboard 엽니다.