열 통계의 API - AWS Glue

열 통계의 API

열 통계 AWS Glue API는 테이블의 열에 대한 통계를 반환하기 위한 API를 설명합니다.

데이터 타입

ColumnStatisticsTaskRun 구조

열 통계 실행의 세부 정보를 표시하는 객체입니다.

필드
  • CustomerId – UTF-8 문자열입니다(12바이트 이하).

    AWS 계정 ID입니다.

  • ColumnStatisticsTaskRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    특정 열 통계 작업 실행의 식별자입니다.

  • DatabaseName – UTF-8 문자열입니다.

    테이블이 상주하는 데이터베이스.

  • TableName – UTF-8 문자열입니다.

    열 통계가 생성되는 테이블의 이름입니다.

  • ColumnNameList – UTF-8 문자열의 배열입니다.

    열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.

  • CatalogIDSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • Role – UTF-8 문자열입니다.

    서비스가 통계를 생성하기 위해 맡을 IAM 역할.

  • SampleSize – 100 이하의 숫자(실수)입니다.

    통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.

  • SecurityConfiguration – 128바이트 이하 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.

  • NumberOfWorkers – 1 이상의 숫자(정수)입니다.

    열 통계를 생성하는 데 사용된 작업자 수입니다. 작업은 인스턴스 25개까지 자동 확장되도록 사전 구성되어 있습니다.

  • WorkerTypeSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 생성에 사용되는 작업자 유형. 기본값은 g.1x입니다.

  • ComputationType – UTF-8 문자열입니다(유효한 값: FULL | INCREMENTAL).

    열 통계 계산의 유형입니다.

  • Status – UTF-8 문자열입니다(유효한 값: STARTING | RUNNING | SUCCEEDED | FAILED | STOPPED).

    실행된 작업의 상태입니다.

  • CreationTime – 타임스탬프입니다.

    이 작업이 생성된 시각입니다.

  • LastUpdated – 타임스탬프입니다.

    이 작업이 마지막으로 수정된 시점.

  • StartTime – 타임스탬프입니다.

    이벤트의 시작 시각.

  • EndTime – 타임스탬프입니다.

    작업의 종료 시각.

  • ErrorMessageURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    작업에 대한 오류 메시지입니다.

  • DPUSeconds – None 이하의 숫자(실수)입니다.

    자동 크기 조정된 모든 작업자의 계산된 DPU 사용량(초 단위).

ColumnStatisticsTaskSettings 구조

열 통계 작업의 설정입니다.

필드
  • DatabaseName – UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName – UTF-8 문자열입니다.

    열 통계를 생성할 테이블의 이름입니다.

  • Schedule일정 객체입니다.

    CRON 구문에 지정된 열 통계 실행 일정입니다.

  • ColumnNameList – UTF-8 문자열의 배열입니다.

    통계를 실행할 열 이름의 목록입니다.

  • CatalogIDSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    데이터베이스가 있는 데이터 카탈로그의 ID입니다.

  • Role – UTF-8 문자열입니다.

    열 통계를 실행하는 데 사용되는 역할입니다.

  • SampleSize – 100 이하의 숫자(실수)입니다.

    샘플링할 데이터의 백분율입니다.

  • SecurityConfiguration – 128바이트 이하 길이의 UTF-8 문자열입니다.

    CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.

  • ScheduleType – UTF-8 문자열입니다(유효한 값: CRON | AUTO).

    열 통계 작업의 일정 유형입니다. 가능한 값은 CRON 또는 AUTO입니다.

  • SettingSource – UTF-8 문자열입니다(유효한 값: CATALOG | TABLE).

    열 통계 작업 설정의 소스입니다. 가능한 값은 CATALOG 또는 TABLE입니다.

  • LastExecutionAttemptExecutionAttempt 객체입니다.

    열 통계 작업 실행의 마지막 ExecutionAttempt입니다.

ExecutionAttempt 구조

열 통계 작업 실행의 실행 시도입니다.

필드
  • Status – UTF-8 문자열입니다(유효한 값: FAILED | STARTED).

    마지막 열 통계 작업 실행의 상태입니다.

  • ColumnStatisticsTaskRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    마지막 열 통계 작업 실행의 작업 실행 ID입니다.

  • ExecutionTimestamp – 타임스탬프입니다.

    마지막 열 통계 작업 실행이 발생한 타임스탬프입니다.

  • ErrorMessageURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    마지막 열 통계 작업 실행과 관련한 오류 메시지입니다.

운영

StartColumnStatisticsTaskRun 작업 (Python: start_column_statistics_task_run)

지정된 테이블 및 열에 대해 열 통계 작업 실행을 시작합니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계를 생성할 테이블의 이름입니다.

  • ColumnNameList – UTF-8 문자열의 배열입니다.

    통계를 생성할 열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.

  • Role필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    서비스가 통계를 생성하기 위해 맡을 IAM 역할.

  • SampleSize – 100 이하의 숫자(실수)입니다.

    통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.

  • CatalogIDSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • SecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.

응답
  • ColumnStatisticsTaskRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행의 식별자입니다.

오류
  • AccessDeniedException

  • EntityNotFoundException

  • ColumnStatisticsTaskRunningException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • InvalidInputException

GetColumnStatisticsTaskRun 작업 (Python: get_column_statistics_task_run)

작업 실행 ID가 주어지면 작업 실행과 관련된 메타데이터/정보를 가져옵니다.

요청
  • ColumnStatisticsTaskRunId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    특정 열 통계 작업 실행의 식별자입니다.

응답
  • ColumnStatisticsTaskRunColumnStatisticsTaskRun 객체입니다.

    열 통계 실행의 세부 정보를 나타내는 ColumnStatisticsTaskRun 객체입니다.

오류
  • EntityNotFoundException

  • OperationTimeoutException

  • InvalidInputException

GetColumnStatisticsTaskRuns 작업 (Python: get_column_statistics_task_runs)

지정된 테이블과 관련된 모든 실행에 대한 정보를 검색합니다.

요청
  • DatabaseName필수: UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    응답의 최대 크기입니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 지속적으로 호출되면 지속적인 토큰입니다.

응답
  • ColumnStatisticsTaskRunsColumnStatisticsTaskRun 객체의 배열입니다.

    실행된 작업의 열 통계 목록입니다.

  • NextToken – UTF-8 문자열입니다.

    실행된 작업이 아직 모두 반환되지 않은 경우의 지속 토큰입니다.

오류
  • OperationTimeoutException

ListColumnStatisticsTaskRuns 작업 (Python: list_column_statistics_task_runs)

특정 계정에 대해 실행된 모든 작업을 나열합니다.

요청
  • MaxResults – 1~1,000의 숫자(정수)입니다.

    응답의 최대 크기입니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 지속적으로 호출되면 지속적인 토큰입니다.

응답
  • ColumnStatisticsTaskRunIds – 100개 이하의 문자열로 구성된 UTF-8 문자열입니다.

    열 통계 작업 실행 ID 목록.

  • NextToken – UTF-8 문자열입니다.

    실행된 작업 ID가 아직 전부 반환되지 않은 경우의 지속 토큰입니다.

오류
  • OperationTimeoutException

StopColumnStatisticsTaskRun 작업 (Python: stop_column_statistics_task_run)

지정된 테이블에 대한 작업 실행을 중지합니다.

요청
  • DatabaseName필수: UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • ColumnStatisticsTaskNotRunningException

  • ColumnStatisticsTaskStoppingException

  • OperationTimeoutException

CreateColumnStatisticsTaskSettings 작업(Python: create_column_statistics_task_settings)

열 통계 작업에 대한 설정을 생성합니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계를 생성할 테이블의 이름입니다.

  • Role필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계를 실행하는 데 사용되는 역할입니다.

  • Schedule – UTF-8 문자열입니다.

    CRON 구문에 지정된 열 통계 실행 일정입니다.

  • ColumnNameList – UTF-8 문자열의 배열입니다.

    통계를 실행할 열 이름의 목록입니다.

  • SampleSize – 100 이하의 숫자(실수)입니다.

    샘플링할 데이터의 백분율입니다.

  • CatalogIDSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터베이스가 있는 데이터 카탈로그의 ID입니다.

  • SecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.

  • Tags – 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.

    각 키는 길이가 1~128바이트인 UTF-8 문자열입니다.

    각 값은 256 바이트 이하 길이의 UTF-8 문자열입니다.

    태그의 맵입니다.

응답
  • 무응답 파라미터.

오류
  • AlreadyExistsException

  • AccessDeniedException

  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • ColumnStatisticsTaskRunningException

UpdateColumnStatisticsTaskSettings 작업(Python: update_column_statistics_task_settings)

열 통계 작업의 설정을 업데이트합니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계를 생성할 테이블의 이름입니다.

  • RoleSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계를 실행하는 데 사용되는 역할입니다.

  • Schedule – UTF-8 문자열입니다.

    CRON 구문에 지정된 열 통계 실행 일정입니다.

  • ColumnNameList – UTF-8 문자열의 배열입니다.

    통계를 실행할 열 이름의 목록입니다.

  • SampleSize – 100 이하의 숫자(실수)입니다.

    샘플링할 데이터의 백분율입니다.

  • CatalogIDSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터베이스가 있는 데이터 카탈로그의 ID입니다.

  • SecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.

응답
  • 무응답 파라미터.

오류
  • AccessDeniedException

  • EntityNotFoundException

  • InvalidInputException

  • VersionMismatchException

  • OperationTimeoutException

GetColumnStatisticsTaskSettings 작업(Python: get_column_statistics_task_settings)

열 통계 작업의 설정을 가져옵니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계를 검색할 테이블의 이름입니다.

응답
  • ColumnStatisticsTaskSettingsColumnStatisticsTaskSettings 객체입니다.

    열 통계 작업의 설정을 나타내는 ColumnStatisticsTaskSettings 객체입니다.

오류
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

DeleteColumnStatisticsTaskSettings 작업(Python: delete_column_statistics_task_settings)

열 통계 작업의 설정을 삭제합니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계를 삭제할 테이블의 이름입니다.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

StartColumnStatisticsTaskRunSchedule 작업(Python: start_column_statistics_task_run_schedule)

열 통계 작업 실행 일정을 시작합니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행 일정을 시작할 테이블의 이름입니다.

응답
  • 무응답 파라미터.

오류
  • AccessDeniedException

  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

StopColumnStatisticsTaskRunSchedule 작업(Python: stop_column_statistics_task_run_schedule)

열 통계 작업 실행 일정을 중지합니다.

요청
  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터베이스의 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열 통계 작업 실행 일정을 중지할 테이블의 이름입니다.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

예외

ColumnStatisticsTaskRunningException 구조

열 통계 생성 작업을 실행하는 동안 다른 작업을 시작하려고 하면 예외가 발생합니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지

ColumnStatisticsTaskNotRunningException 구조

실행 중인 작업이 없을 때 작업 실행을 중지하려고 하면 예외가 발생합니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지

ColumnStatisticsTaskStoppingException 구조

작업 실행을 중지하려고 할 때 발생하는 예외입니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지

ColumnStatisticsTaskAutoConcurrencyLimitException 구조

동시 자동 통계 작업의 한도에 이미 도달했을 때 발생하는 예외입니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지

InvalidCatalogSettingException 구조

카탈로그 설정에 문제가 있을 때 발생하는 예외입니다.

필드
  • Message – UTF-8 문자열입니다.

    문제를 설명하는 메시지