열 통계의 API
열 통계 AWS Glue API는 테이블의 열에 대한 통계를 반환하기 위한 API를 설명합니다.
데이터 타입
ColumnStatisticsTaskRun 구조
열 통계 실행의 세부 정보를 표시하는 객체입니다.
필드
-
CustomerId
– UTF-8 문자열입니다(12바이트 이하).AWS 계정 ID입니다.
-
ColumnStatisticsTaskRunId
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.특정 열 통계 작업 실행의 식별자입니다.
-
DatabaseName
– UTF-8 문자열입니다.테이블이 상주하는 데이터베이스.
-
TableName
– UTF-8 문자열입니다.열 통계가 생성되는 테이블의 이름입니다.
-
ColumnNameList
– UTF-8 문자열의 배열입니다.열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.
-
CatalogID
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.
-
Role
– UTF-8 문자열입니다.서비스가 통계를 생성하기 위해 맡을 IAM 역할.
-
SampleSize
– 100 이하의 숫자(실수)입니다.통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.
-
SecurityConfiguration
– 128바이트 이하 길이의 UTF-8 문자열입니다.열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.
-
NumberOfWorkers
– 1 이상의 숫자(정수)입니다.열 통계를 생성하는 데 사용된 작업자 수입니다. 작업은 인스턴스 25개까지 자동 확장되도록 사전 구성되어 있습니다.
-
WorkerType
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.통계 생성에 사용되는 작업자 유형. 기본값은
g.1x
입니다. -
ComputationType
– UTF-8 문자열입니다(유효한 값:FULL
|INCREMENTAL
).열 통계 계산의 유형입니다.
-
Status
– UTF-8 문자열입니다(유효한 값:STARTING
|RUNNING
|SUCCEEDED
|FAILED
|STOPPED
).실행된 작업의 상태입니다.
-
CreationTime
– 타임스탬프입니다.이 작업이 생성된 시각입니다.
-
LastUpdated
– 타임스탬프입니다.이 작업이 마지막으로 수정된 시점.
-
StartTime
– 타임스탬프입니다.이벤트의 시작 시각.
-
EndTime
– 타임스탬프입니다.작업의 종료 시각.
-
ErrorMessage
– URI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.작업에 대한 오류 메시지입니다.
-
DPUSeconds
– None 이하의 숫자(실수)입니다.자동 크기 조정된 모든 작업자의 계산된 DPU 사용량(초 단위).
ColumnStatisticsTaskSettings 구조
열 통계 작업의 설정입니다.
필드
-
DatabaseName
– UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– UTF-8 문자열입니다.열 통계를 생성할 테이블의 이름입니다.
-
Schedule
– 일정 객체입니다.CRON 구문에 지정된 열 통계 실행 일정입니다.
-
ColumnNameList
– UTF-8 문자열의 배열입니다.통계를 실행할 열 이름의 목록입니다.
-
CatalogID
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.데이터베이스가 있는 데이터 카탈로그의 ID입니다.
-
Role
– UTF-8 문자열입니다.열 통계를 실행하는 데 사용되는 역할입니다.
-
SampleSize
– 100 이하의 숫자(실수)입니다.샘플링할 데이터의 백분율입니다.
-
SecurityConfiguration
– 128바이트 이하 길이의 UTF-8 문자열입니다.CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.
-
ScheduleType
– UTF-8 문자열입니다(유효한 값:CRON
|AUTO
).열 통계 작업의 일정 유형입니다. 가능한 값은
CRON
또는AUTO
입니다. -
SettingSource
– UTF-8 문자열입니다(유효한 값:CATALOG
|TABLE
).열 통계 작업 설정의 소스입니다. 가능한 값은
CATALOG
또는TABLE
입니다. -
LastExecutionAttempt
– ExecutionAttempt 객체입니다.열 통계 작업 실행의 마지막
ExecutionAttempt
입니다.
ExecutionAttempt 구조
열 통계 작업 실행의 실행 시도입니다.
필드
-
Status
– UTF-8 문자열입니다(유효한 값:FAILED
|STARTED
).마지막 열 통계 작업 실행의 상태입니다.
-
ColumnStatisticsTaskRunId
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.마지막 열 통계 작업 실행의 작업 실행 ID입니다.
-
ExecutionTimestamp
– 타임스탬프입니다.마지막 열 통계 작업 실행이 발생한 타임스탬프입니다.
-
ErrorMessage
– URI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.마지막 열 통계 작업 실행과 관련한 오류 메시지입니다.
운영
StartColumnStatisticsTaskRun 작업 (Python: start_column_statistics_task_run)
GetColumnStatisticsTaskRun 작업 (Python: get_column_statistics_task_run)
GetColumnStatisticsTaskRuns 작업 (Python: get_column_statistics_task_runs)
ListColumnStatisticsTaskRuns 작업 (Python: list_column_statistics_task_runs)
StopColumnStatisticsTaskRun 작업 (Python: stop_column_statistics_task_run)
CreateColumnStatisticsTaskSettings 작업(Python: create_column_statistics_task_settings)
UpdateColumnStatisticsTaskSettings 작업(Python: update_column_statistics_task_settings)
GetColumnStatisticsTaskSettings 작업(Python: get_column_statistics_task_settings)
DeleteColumnStatisticsTaskSettings 작업(Python: delete_column_statistics_task_settings)
StartColumnStatisticsTaskRunSchedule 작업(Python: start_column_statistics_task_run_schedule)
StopColumnStatisticsTaskRunSchedule 작업(Python: stop_column_statistics_task_run_schedule)
StartColumnStatisticsTaskRun 작업 (Python: start_column_statistics_task_run)
지정된 테이블 및 열에 대해 열 통계 작업 실행을 시작합니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.통계를 생성할 테이블의 이름입니다.
-
ColumnNameList
– UTF-8 문자열의 배열입니다.통계를 생성할 열 이름의 목록입니다. 제공되지 않은 경우 기본적으로 테이블의 모든 열 이름이 사용됩니다.
-
Role
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.서비스가 통계를 생성하기 위해 맡을 IAM 역할.
-
SampleSize
– 100 이하의 숫자(실수)입니다.통계 생성에 사용된 행의 비율. 제공되지 않은 경우 전체 테이블을 사용하여 통계를 생성합니다.
-
CatalogID
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.
-
SecurityConfiguration
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계 작업 실행의 CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.
응답
-
ColumnStatisticsTaskRunId
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계 작업 실행의 식별자입니다.
오류
AccessDeniedException
EntityNotFoundException
ColumnStatisticsTaskRunningException
OperationTimeoutException
ResourceNumberLimitExceededException
InvalidInputException
GetColumnStatisticsTaskRun 작업 (Python: get_column_statistics_task_run)
작업 실행 ID가 주어지면 작업 실행과 관련된 메타데이터/정보를 가져옵니다.
요청
-
ColumnStatisticsTaskRunId
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.특정 열 통계 작업 실행의 식별자입니다.
응답
-
ColumnStatisticsTaskRun
– ColumnStatisticsTaskRun 객체입니다.열 통계 실행의 세부 정보를 나타내는
ColumnStatisticsTaskRun
객체입니다.
오류
EntityNotFoundException
OperationTimeoutException
InvalidInputException
GetColumnStatisticsTaskRuns 작업 (Python: get_column_statistics_task_runs)
지정된 테이블과 관련된 모든 실행에 대한 정보를 검색합니다.
요청
-
DatabaseName
– 필수: UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블의 이름
-
MaxResults
– 1~1,000의 숫자(정수)입니다.응답의 최대 크기입니다.
-
NextToken
– UTF-8 문자열입니다.이것이 지속적으로 호출되면 지속적인 토큰입니다.
응답
-
ColumnStatisticsTaskRuns
– ColumnStatisticsTaskRun 객체의 배열입니다.실행된 작업의 열 통계 목록입니다.
-
NextToken
– UTF-8 문자열입니다.실행된 작업이 아직 모두 반환되지 않은 경우의 지속 토큰입니다.
오류
OperationTimeoutException
ListColumnStatisticsTaskRuns 작업 (Python: list_column_statistics_task_runs)
특정 계정에 대해 실행된 모든 작업을 나열합니다.
요청
-
MaxResults
– 1~1,000의 숫자(정수)입니다.응답의 최대 크기입니다.
-
NextToken
– UTF-8 문자열입니다.이것이 지속적으로 호출되면 지속적인 토큰입니다.
응답
-
ColumnStatisticsTaskRunIds
– 100개 이하의 문자열로 구성된 UTF-8 문자열입니다.열 통계 작업 실행 ID 목록.
-
NextToken
– UTF-8 문자열입니다.실행된 작업 ID가 아직 전부 반환되지 않은 경우의 지속 토큰입니다.
오류
OperationTimeoutException
StopColumnStatisticsTaskRun 작업 (Python: stop_column_statistics_task_run)
지정된 테이블에 대한 작업 실행을 중지합니다.
요청
-
DatabaseName
– 필수: UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블의 이름
응답
무응답 파라미터.
오류
EntityNotFoundException
ColumnStatisticsTaskNotRunningException
ColumnStatisticsTaskStoppingException
OperationTimeoutException
CreateColumnStatisticsTaskSettings 작업(Python: create_column_statistics_task_settings)
열 통계 작업에 대한 설정을 생성합니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계를 생성할 테이블의 이름입니다.
-
Role
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계를 실행하는 데 사용되는 역할입니다.
-
Schedule
– UTF-8 문자열입니다.CRON 구문에 지정된 열 통계 실행 일정입니다.
-
ColumnNameList
– UTF-8 문자열의 배열입니다.통계를 실행할 열 이름의 목록입니다.
-
SampleSize
– 100 이하의 숫자(실수)입니다.샘플링할 데이터의 백분율입니다.
-
CatalogID
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.데이터베이스가 있는 데이터 카탈로그의 ID입니다.
-
SecurityConfiguration
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.
-
Tags
– 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.각 키는 길이가 1~128바이트인 UTF-8 문자열입니다.
각 값은 256 바이트 이하 길이의 UTF-8 문자열입니다.
태그의 맵입니다.
응답
무응답 파라미터.
오류
AlreadyExistsException
AccessDeniedException
EntityNotFoundException
InvalidInputException
OperationTimeoutException
ResourceNumberLimitExceededException
ColumnStatisticsTaskRunningException
UpdateColumnStatisticsTaskSettings 작업(Python: update_column_statistics_task_settings)
열 통계 작업의 설정을 업데이트합니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계를 생성할 테이블의 이름입니다.
-
Role
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계를 실행하는 데 사용되는 역할입니다.
-
Schedule
– UTF-8 문자열입니다.CRON 구문에 지정된 열 통계 실행 일정입니다.
-
ColumnNameList
– UTF-8 문자열의 배열입니다.통계를 실행할 열 이름의 목록입니다.
-
SampleSize
– 100 이하의 숫자(실수)입니다.샘플링할 데이터의 백분율입니다.
-
CatalogID
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.데이터베이스가 있는 데이터 카탈로그의 ID입니다.
-
SecurityConfiguration
– Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.CloudWatch 로그를 암호화하는 데 사용되는 보안 구성의 이름입니다.
응답
무응답 파라미터.
오류
AccessDeniedException
EntityNotFoundException
InvalidInputException
VersionMismatchException
OperationTimeoutException
GetColumnStatisticsTaskSettings 작업(Python: get_column_statistics_task_settings)
열 통계 작업의 설정을 가져옵니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계를 검색할 테이블의 이름입니다.
응답
-
ColumnStatisticsTaskSettings
– ColumnStatisticsTaskSettings 객체입니다.열 통계 작업의 설정을 나타내는
ColumnStatisticsTaskSettings
객체입니다.
오류
EntityNotFoundException
InvalidInputException
OperationTimeoutException
DeleteColumnStatisticsTaskSettings 작업(Python: delete_column_statistics_task_settings)
열 통계 작업의 설정을 삭제합니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계를 삭제할 테이블의 이름입니다.
응답
무응답 파라미터.
오류
EntityNotFoundException
InvalidInputException
OperationTimeoutException
StartColumnStatisticsTaskRunSchedule 작업(Python: start_column_statistics_task_run_schedule)
열 통계 작업 실행 일정을 시작합니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계 작업 실행 일정을 시작할 테이블의 이름입니다.
응답
무응답 파라미터.
오류
AccessDeniedException
EntityNotFoundException
InvalidInputException
OperationTimeoutException
StopColumnStatisticsTaskRunSchedule 작업(Python: stop_column_statistics_task_run_schedule)
열 통계 작업 실행 일정을 중지합니다.
요청
-
DatabaseName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.테이블이 있는 데이터베이스의 이름입니다.
-
TableName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.열 통계 작업 실행 일정을 중지할 테이블의 이름입니다.
응답
무응답 파라미터.
오류
EntityNotFoundException
InvalidInputException
OperationTimeoutException
예외
ColumnStatisticsTaskRunningException 구조
열 통계 생성 작업을 실행하는 동안 다른 작업을 시작하려고 하면 예외가 발생합니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지
ColumnStatisticsTaskNotRunningException 구조
실행 중인 작업이 없을 때 작업 실행을 중지하려고 하면 예외가 발생합니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지
ColumnStatisticsTaskStoppingException 구조
작업 실행을 중지하려고 할 때 발생하는 예외입니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지
ColumnStatisticsTaskAutoConcurrencyLimitException 구조
동시 자동 통계 작업의 한도에 이미 도달했을 때 발생하는 예외입니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지
InvalidCatalogSettingException 구조
카탈로그 설정에 문제가 있을 때 발생하는 예외입니다.
필드
-
Message
– UTF-8 문자열입니다.문제를 설명하는 메시지