열 통계의 API
열 통계 AWS Glue API는 테이블의 열에 대한 통계를 반환하기 위한 API를 설명합니다.
데이터 타입
ColumnStatisticsTaskRun 구조
열 통계 실행의 세부 정보를 표시하는 객체입니다.
필드
-
CustomerId
– UTF-8 문자열입니다(12바이트 이하).AWS 계정 ID입니다.
-
ColumnStatisticsTaskRunId
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.특정 열 통계 작업 실행의 식별자입니다.
-
DatabaseName
– UTF-8 문자열입니다.테이블이 상주하는 데이터베이스.
-
TableName
– UTF-8 문자열입니다.열 통계가 생성되는 테이블의 이름입니다.
-
ColumnNameList
– UTF-8 문자열의 배열입니다.열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.
-
CatalogID
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.
-
Role
– UTF-8 문자열입니다.서비스가 통계를 생성하기 위해 맡을 IAM 역할.
-
SampleSize
– 100 이하의 숫자(실수)입니다.통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.
-
SecurityConfiguration
– 128바이트 이하 길이의 UTF-8 문자열입니다.열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.
-
NumberOfWorkers
– 1 이상의 숫자(정수)입니다.열 통계를 생성하는 데 사용된 작업자 수입니다. 작업은 인스턴스 25개까지 자동 확장되도록 사전 구성되어 있습니다.
-
WorkerType
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.통계 생성에 사용되는 작업자 유형. 기본값은
g.1x
입니다. -
Status
– UTF-8 문자열입니다(유효한 값:STARTING
|RUNNING
|SUCCEEDED
|FAILED
|STOPPED
).실행된 작업의 상태입니다.
-
CreationTime
– 타임스탬프입니다.이 작업이 생성된 시각입니다.
-
LastUpdated
– 타임스탬프입니다.이 작업이 마지막으로 수정된 시점.
-
StartTime
– 타임스탬프입니다.이벤트의 시작 시각.
-
EndTime
– 타임스탬프입니다.작업의 종료 시각.
-
ErrorMessage
– URI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.작업에 대한 오류 메시지입니다.
-
DPUSeconds
– None 이하의 숫자(실수)입니다.자동 크기 조정된 모든 작업자의 계산된 DPU 사용량(초 단위).
ColumnStatisticsTaskRunningException 구조
열 통계 생성 작업을 실행하는 동안 다른 작업을 시작하려고 하면 예외가 발생합니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지
ColumnStatisticsTaskNotRunningException 구조
실행 중인 작업이 없을 때 작업 실행을 중지하려고 하면 예외가 발생합니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지
ColumnStatisticsTaskStoppingException 구조
작업 실행을 중지하려고 할 때 발생하는 예외입니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지
운영
StartColumnStatisticsTaskRun 작업 (Python: start_column_statistics_task_run)
GetColumnStatisticsTaskRun 작업 (Python: get_column_statistics_task_run)
GetColumnStatisticsTaskRuns 작업 (Python: get_column_statistics_task_runs)
ListColumnStatisticsTaskRuns 작업 (Python: list_column_statistics_task_runs)
StopColumnStatisticsTaskRun 작업 (Python: stop_column_statistics_task_run)
StartColumnStatisticsTaskRun 작업 (Python: start_column_statistics_task_run)
지정된 테이블 및 열에 대해 열 통계 작업 실행을 시작합니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.통계를 생성할 테이블의 이름입니다.
-
ColumnNameList
– UTF-8 문자열의 배열입니다.통계를 생성할 열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.
-
Role
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.서비스가 통계를 생성하기 위해 맡을 IAM 역할.
-
SampleSize
– 100 이하의 숫자(실수)입니다.통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.
-
CatalogID
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.
-
SecurityConfiguration
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.
응답
-
ColumnStatisticsTaskRunId
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계 작업 실행의 식별자입니다.
Errors
AccessDeniedException
EntityNotFoundException
ColumnStatisticsTaskRunningException
OperationTimeoutException
ResourceNumberLimitExceededException
InvalidInputException
GetColumnStatisticsTaskRun 작업 (Python: get_column_statistics_task_run)
작업 실행 ID가 주어지면 작업 실행과 관련된 메타데이터/정보를 가져옵니다.
요청
-
ColumnStatisticsTaskRunId
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.특정 열 통계 작업 실행의 식별자입니다.
응답
-
ColumnStatisticsTaskRun
– ColumnStatisticsTaskRun 객체입니다.열 통계 실행의 세부 정보를 나타내는
ColumnStatisticsTaskRun
객체입니다.
Errors
EntityNotFoundException
OperationTimeoutException
InvalidInputException
GetColumnStatisticsTaskRuns 작업 (Python: get_column_statistics_task_runs)
지정된 테이블과 관련된 모든 실행에 대한 정보를 검색합니다.
요청
-
DatabaseName
– 필수: UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블의 이름
-
MaxResults
– 1~1,000의 숫자(정수)입니다.응답의 최대 크기입니다.
-
NextToken
– UTF-8 문자열입니다.이것이 지속적으로 호출되면 지속적인 토큰입니다.
응답
-
ColumnStatisticsTaskRuns
– ColumnStatisticsTaskRun 객체의 배열입니다.실행된 작업의 열 통계 목록입니다.
-
NextToken
– UTF-8 문자열입니다.실행된 작업이 아직 모두 반환되지 않은 경우의 지속 토큰입니다.
Errors
OperationTimeoutException
ListColumnStatisticsTaskRuns 작업 (Python: list_column_statistics_task_runs)
특정 계정에 대해 실행된 모든 작업을 나열합니다.
요청
-
MaxResults
– 1~1,000의 숫자(정수)입니다.응답의 최대 크기입니다.
-
NextToken
– UTF-8 문자열입니다.이것이 지속적으로 호출되면 지속적인 토큰입니다.
응답
-
ColumnStatisticsTaskRunIds
– 100개 이하의 문자열로 구성된 UTF-8 문자열입니다.열 통계 작업 실행 ID 목록.
-
NextToken
– UTF-8 문자열입니다.실행된 작업 ID가 아직 전부 반환되지 않은 경우의 지속 토큰입니다.
Errors
OperationTimeoutException
StopColumnStatisticsTaskRun 작업 (Python: stop_column_statistics_task_run)
지정된 테이블에 대한 작업 실행을 중지합니다.
요청
-
DatabaseName
– 필수: UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블의 이름
응답
무응답 파라미터.
Errors
EntityNotFoundException
ColumnStatisticsTaskNotRunningException
ColumnStatisticsTaskStoppingException
OperationTimeoutException