Amazon Redshift가 구성된 Amazon RDS 제로 ETL 통합 시작하기 - Amazon Relational Database Service

Amazon Redshift가 구성된 Amazon RDS 제로 ETL 통합 시작하기

이 문서는 미리 보기 릴리스 중이며 Amazon Redshift가 구성된 Amazon RDS 제로 ETL 통합에 대한 미리 보기 릴리스 설명서입니다. 설명서 및 기능은 모두 변경될 수 있습니다. 프로덕션 환경이 아닌 테스트 환경에서만 이 기능을 사용하는 것이 좋습니다. 미리 보기 이용 약관은 AWS 서비스 약관베타 및 미리 보기를 참조하세요.

Amazon Redshift가 구성된 제로 ETL 통합을 생성하기 전에 필수 파라미터와 권한을 사용하여 RDS 데이터베이스와 Amazon Redshift 데이터 웨어하우스를 구성합니다. 설정 중에 다음 단계를 완료해야 합니다.

이러한 작업을 완료한 후 Amazon Redshift가 구성된 Amazon RDS 제로 ETL 통합 생성으로 이동합니다.

1단계: 사용자 지정 DB 파라미터 그룹 생성

Amazon Redshift가 구성된 Amazon RDS 제로 ETL 통합은 이진 로깅(binlog)을 제어하는 DB 파라미터에 대한 특정 값을 필요로 합니다. 바이너리 로깅을 구성하려면 먼저 사용자 지정 DB 파라미터 그룹을 만든 다음 이를 소스 데이터베이스와 연결해야 합니다.

다음 설정을 사용하여 사용자 지정 DB 파라미터 그룹을 생성합니다. 파라미터 그룹을 만드는 방법에 대한 지침은 DB 인스턴스의 DB 파라미터 그룹 작업 섹션을 참조하세요.

  • binlog_format=ROW

  • binlog_row_image=full

  • binlog_checksum=NONE

또한 binlog_row_value_options 파라미터가 PARTIAL_JSON으로 설정되어 있지 않아야 합니다.

2단계: 소스 데이터베이스 선택 또는 생성

사용자 지정 DB 파라미터 그룹을 생성한 후 RDS for MySQL 단일 AZ 또는 다중 AZ DB 인스턴스를 선택 또는 생성합니다. 이 데이터베이스는 Amazon Redshift로의 데이터 복제 소스가 됩니다.

데이터베이스RDS for MySQL 버전 8.0.32 이상을 실행해야 합니다. 단일 AZ 또는 다중 AZ DB 인스턴스를 만드는 방법에 대한 지침은 Amazon RDS DB 인스턴스 생성 섹션을 참조하세요.

추가 구성에서 기본 DB 파라미터 그룹을 이전 단계에서 생성한 사용자 지정 파라미터 그룹으로 변경합니다.

참고

, 데이터베이스가 이미 생성된 후에 데이터베이스와 파라미터 그룹을 연결한다면 제로 ETL 통합을 만들기 전에 데이터베이스를 재부팅하여 변경 사향을 적용해야 합니다. 지침은 DB 인스턴스 재부팅 섹션을 참조하세요.

또한 데이터베이스에서 자동 백업이 활성화되어 있는지 확인하세요. 자세한 내용은 자동 백업 활성화 단원을 참조하십시오.

3단계: 대상 Amazon Redshift 데이터 웨어하우스 생성

소스 데이터베이스를 생성한 후에는 Amazon Redshift에서 대상 데이터 웨어하우스를 생성하고 구성해야 합니다. 데이터 웨어하우스는 다음 요구 사항을 충족해야 합니다.

  • 미리 보기에서 생성되었습니다

    • 미리 보기에서 프로비저닝된 클러스터를 생성하려면 프로비저닝된 클러스터 대시보드의 배너에서 미리 보기 클러스터 생성을 선택합니다. 자세한 내용은 미리 보기 클러스터 생성 섹션을 참조하세요.

      클러스터를 생성할 때 미리 보기 트랙preview_2023으로 설정하세요.

    • 미리 보기에서 Redshift Serverless 작업 그룹을 만들려면 서버리스 대시보드의 배너에서 미리 보기 작업 그룹 생성을 선택합니다. 자세한 내용은 미리 보기 작업 그룹 생성 섹션을 참조하세요.

  • 최소 2개 이상의 노드가 있는 RA3 노드 유형(ra3.xlplus, ra3.4xlarge, ra3.16xlarge) 또는 Redshift Serverless를 사용합니다.

  • 암호화되어 있습니다(프로비저닝된 클러스터를 사용하는 경우). 자세한 내용은 Amazon Redshift 데이터베이스 암호화를 참조하세요.

데이터 웨어하우스를 만드는 방법에 대한 지침은 프로비전된 클러스터의 경우 클러스터 생성을, Redshift Serverless의 경우 네임스페이스가 있는 작업 그룹 생성을 참조하세요.

데이터 웨어하우스에서 대/소문자 구분 활성화

통합이 성공하려면 데이터 웨어하우스에서 대/소문자 구분 파라미터(enable_case_sensitive_identifier)를 활성화해야 합니다. 기본적으로 모든 프로비저닝된 클러스터와 Redshift Serverless 작업 그룹에서 대/소문자 구분이 비활성화되어 있습니다.

대/소문자 구분을 활성화하려면 데이터 웨어하우스 유형에 따라 다음 단계를 수행하세요.

  • 프로비저닝된 클러스터 - 프로비저닝된 클러스터에서 대/소문자 구분을 활성화하려면 enable_case_sensitive_identifier 파라미터가 활성화된 사용자 지정 파라미터 그룹을 생성합니다. 그런 다음 이 파라미터 그룹을 클러스터와 연결합니다. 자세한 지침은 콘솔을 사용한 파라미터 그룹 관리 또는 AWS CLI를 사용한 파라미터 값 구성을 참조하세요.

    참고

    사용자 지정 파라미터 그룹을 연결한 후 클러스터를 재부팅해야 합니다.

  • Serverless 작업 그룹 - Redshift Serverless 작업 그룹에서 대/소문자 구분을 활성화하려면 AWS CLI를 사용해야 합니다. Amazon Redshift 콘솔은 현재 Redshift Serverless 파라미터 값 수정을 지원하지 않습니다. 다음 update-workgroup 업데이트 요청을 보냅니다.

    aws redshift-serverless update-workgroup \ --workgroup-name target-workgroup \ --config-parameters parameterKey=enable_case_sensitive_identifier,parameterValue=true

    작업 그룹의 파라미터 값을 수정한 후 작업 그룹을 재부팅할 필요가 없습니다.

데이터 웨어하우스에 대한 권한 부여 구성

데이터 웨어하우스를 만든 후에는 소스 RDS 데이터베이스를 승인된 통합 소스로 구성해야 합니다. 자세한 지침은 Amazon Redshift 데이터 웨어하우스에 대한 권한 부여 구성을 참조하세요.

다음 단계

소스 RDS 데이터베이스와 Amazon Redshift 대상 데이터 웨어하우스가 있으므로, 이제 제로 ETL 통합을 생성하고 데이터를 복제할 수 있습니다. 지침은 Amazon Redshift가 구성된 Amazon RDS 제로 ETL 통합 생성 단원을 참조하세요.