컴팩션 옵티마이저 활성화 - AWS 글루

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

컴팩션 옵티마이저 활성화

다음을 사용할 수 있음: AWS Glue 콘솔, AWS CLI, 또는 AWS APIApache Iceberg 테이블의 압축을 활성화하려면 AWS Glue 데이터 카탈로그. 새 테이블의 경우 Apache Iceberg를 테이블 형식으로 선택하고 테이블을 생성할 때 압축을 활성화할 수 있습니다. 압축 기능은 새 테이블에 대해 기본적으로 비활성화되어 있습니다.

Console
압축을 활성화하려면
  1. 를 엽니다. AWS Glue 에서 https://console.aws.amazon.com/glue/콘솔을 열고 데이터 레이크 관리자, 테이블 작성자 또는 테이블에 대한 glue:UpdateTablelakeformation:GetDataAccess 권한을 부여받은 사용자로 로그인합니다.

  2. 탐색 창의 데이터 카탈로그에서 테이블을 선택합니다.

  3. 테이블 페이지에서 압축을 활성화하려는 열린 테이블 형식의 테이블을 선택한 다음 작업 메뉴에서 최적화를 선택한 다음 활성화를 선택합니다.

    테이블 세부정보 페이지에서 테이블 최적화 탭을 선택하여 압축을 활성화할 수도 있습니다. 페이지 하단에서 테이블 최적화 탭을 선택하고 압축 활성화를 선택합니다.

    데이터 카탈로그에서 새 Iceberg 테이블을 만들 때도 최적화 활성화 옵션을 사용할 수 있습니다.

  4. 최적화 활성화 페이지의 최적화 옵션에서 압축을 선택합니다.

    압축 활성화 옵션이 있는 Apache Iceberg 테이블 세부 정보 페이지입니다.
  5. 그런 다음 테이블 최적화 필수 조건 섹션에 표시된 권한이 있는 IAM 역할을 드롭다운에서 선택합니다.

    새 IAM 역할 만들기 옵션을 선택하여 압축을 실행하는 데 필요한 권한이 있는 사용자 지정 역할을 생성할 수도 있습니다.

    아래 단계에 따라 기존 IAM 역할을 업데이트하세요.

    1. IAM역할에 대한 권한 정책을 업데이트하려면 IAM 콘솔에서 압축을 실행하는 데 사용되는 IAM 역할로 이동합니다.

    2. 권한 추가 섹션에서 정책 생성을 선택합니다. 새로 열린 브라우저 창에서 역할에 사용할 새 정책을 생성합니다.

    3. 정책 생성 페이지에서 JSON 탭을 선택합니다. 필수 조건에 표시된 JSON 코드를 정책 편집기 필드에 복사합니다.

  6. 최적화 활성화를 선택합니다.

AWS CLI

다음 예제는 압축 기능을 활성화하는 방법을 보여줍니다. 계정 ID를 유효한 것으로 교체하십시오. AWS 계정 ID. 데이터베이스 이름과 테이블 이름을 실제 Iceberg 테이블 이름 및 데이터베이스 이름으로 바꿉니다. 를 다음으로 roleArn 바꾸십시오. AWS IAM역할의 리소스 이름 (ARN) 및 압축을 실행하는 데 필요한 권한이 있는 IAM 역할의 이름.

aws glue create-table-optimizer \ --catalog-id 123456789012 \ --database-name iceberg_db \ --table-name iceberg_table \ --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role", "enabled":'true'}' \ --type compaction
AWS API

CreateTableOptimizer 작업을 호출하여 테이블의 압축을 활성화합니다.

압축을 활성화하면 테이블 최적화 탭에 다음과 같은 압축 세부 정보가 표시됩니다(약 15~20분 후).

시작 시간

압축 프로세스가 데이터 카탈로그에서 시작되는 시간입니다. 값은 타임스탬프 (시간) 입니다. UTC

종료 시간

압축 프로세스가 데이터 카탈로그에서 끝나는 시간입니다. 값은 타임스탬프 (시간) 입니다. UTC

상태 표시기

압축 실행의 상태입니다. 값은 성공 또는 실패입니다.

압축된 파일 수

압축된 총 파일 수입니다.

압축된 바이트 수

압축된 총 바이트 수입니다.