열 통계의 API - AWS Glue

열 통계의 API

열 통계 AWS Glue API는 테이블의 열에 대한 통계를 반환하기 위한 API를 설명합니다.

데이터 타입

ColumnStatisticsTaskRun 구조

열 통계 실행의 세부 정보를 표시하는 객체입니다.

필드
  • CustomerId – UTF-8 문자열입니다(12바이트 이하).

    AWS 계정 ID입니다.

  • ColumnStatisticsTaskRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    특정 열 통계 작업 실행의 식별자입니다.

  • DatabaseName – UTF-8 문자열입니다.

    테이블이 상주하는 데이터베이스.

  • TableName – UTF-8 문자열입니다.

    열 통계가 생성되는 테이블의 이름입니다.

  • ColumnNameList – UTF-8 문자열의 배열입니다.

    열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.

  • CatalogIDSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • Role – UTF-8 문자열입니다.

    서비스가 통계를 생성하기 위해 맡을 IAM 역할.

  • SampleSize – 100 이하의 숫자(실수)입니다.

    통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.

  • SecurityConfiguration – 128바이트 이하 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.

  • NumberOfWorkers – 1 이상의 숫자(정수)입니다.

    열 통계를 생성하는 데 사용된 작업자 수입니다. 작업은 인스턴스 25개까지 자동 확장되도록 사전 구성되어 있습니다.

  • WorkerTypeSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 생성에 사용되는 작업자 유형. 기본값은 g.1x입니다.

  • Status – UTF-8 문자열입니다(유효한 값: STARTING | RUNNING | SUCCEEDED | FAILED | STOPPED).

    실행된 작업의 상태입니다.

  • CreationTime – 타임스탬프입니다.

    이 작업이 생성된 시각입니다.

  • LastUpdated – 타임스탬프입니다.

    이 작업이 마지막으로 수정된 시점.

  • StartTime – 타임스탬프입니다.

    이벤트의 시작 시각.

  • EndTime – 타임스탬프입니다.

    작업의 종료 시각.

  • ErrorMessageURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    작업에 대한 오류 메시지입니다.

  • DPUSeconds – None 이하의 숫자(실수)입니다.

    자동 크기 조정된 모든 작업자의 계산된 DPU 사용량(초 단위).

ColumnStatisticsTaskRunningException 구조

열 통계 생성 작업을 실행하는 동안 다른 작업을 시작하려고 하면 예외가 발생합니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지

ColumnStatisticsTaskNotRunningException 구조

실행 중인 작업이 없을 때 작업 실행을 중지하려고 하면 예외가 발생합니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지

ColumnStatisticsTaskStoppingException 구조

작업 실행을 중지하려고 할 때 발생하는 예외입니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지

운영

StartColumnStatisticsTaskRun 작업 (Python: start_column_statistics_task_run)

지정된 테이블 및 열에 대해 열 통계 작업 실행을 시작합니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계를 생성할 테이블의 이름입니다.

  • ColumnNameList – UTF-8 문자열의 배열입니다.

    통계를 생성할 열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.

  • Role필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    서비스가 통계를 생성하기 위해 맡을 IAM 역할.

  • SampleSize – 100 이하의 숫자(실수)입니다.

    통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.

  • CatalogIDSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • SecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.

응답
  • ColumnStatisticsTaskRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행의 식별자입니다.

Errors
  • AccessDeniedException

  • EntityNotFoundException

  • ColumnStatisticsTaskRunningException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • InvalidInputException

GetColumnStatisticsTaskRun 작업 (Python: get_column_statistics_task_run)

작업 실행 ID가 주어지면 작업 실행과 관련된 메타데이터/정보를 가져옵니다.

요청
  • ColumnStatisticsTaskRunId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    특정 열 통계 작업 실행의 식별자입니다.

응답
  • ColumnStatisticsTaskRunColumnStatisticsTaskRun 객체입니다.

    열 통계 실행의 세부 정보를 나타내는 ColumnStatisticsTaskRun 객체입니다.

Errors
  • EntityNotFoundException

  • OperationTimeoutException

  • InvalidInputException

GetColumnStatisticsTaskRuns 작업 (Python: get_column_statistics_task_runs)

지정된 테이블과 관련된 모든 실행에 대한 정보를 검색합니다.

요청
  • DatabaseName필수: UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    응답의 최대 크기입니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 지속적으로 호출되면 지속적인 토큰입니다.

응답
  • ColumnStatisticsTaskRunsColumnStatisticsTaskRun 객체의 배열입니다.

    실행된 작업의 열 통계 목록입니다.

  • NextToken – UTF-8 문자열입니다.

    실행된 작업이 아직 모두 반환되지 않은 경우의 지속 토큰입니다.

Errors
  • OperationTimeoutException

ListColumnStatisticsTaskRuns 작업 (Python: list_column_statistics_task_runs)

특정 계정에 대해 실행된 모든 작업을 나열합니다.

요청
  • MaxResults – 1~1,000의 숫자(정수)입니다.

    응답의 최대 크기입니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 지속적으로 호출되면 지속적인 토큰입니다.

응답
  • ColumnStatisticsTaskRunIds – 100개 이하의 문자열로 구성된 UTF-8 문자열입니다.

    열 통계 작업 실행 ID 목록.

  • NextToken – UTF-8 문자열입니다.

    실행된 작업 ID가 아직 전부 반환되지 않은 경우의 지속 토큰입니다.

Errors
  • OperationTimeoutException

StopColumnStatisticsTaskRun 작업 (Python: stop_column_statistics_task_run)

지정된 테이블에 대한 작업 실행을 중지합니다.

요청
  • DatabaseName필수: UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • ColumnStatisticsTaskNotRunningException

  • ColumnStatisticsTaskStoppingException

  • OperationTimeoutException