데이터 품질 API - AWS Glue
 -  데이터 유형  -DataSourceDataQualityRulesetListDetailsDataQualityTargetTableDataQualityRulesetEvaluationRunDescriptionDataQualityRulesetEvaluationRunFilterDataQualityEvaluationRunAdditionalRunOptionsDataQualityRuleRecommendationRunDescriptionDataQualityRuleRecommendationRunFilterDataQualityResultDataQualityAnalyzerResultDataQualityObservationMetricBasedObservationDataQualityMetricValuesDataQualityRuleResultDataQualityResultDescriptionDataQualityResultFilterCriteriaDataQualityRulesetFilterCriteriaStatisticAnnotationTimestampedInclusionAnnotationAnnotationErrorDatapointInclusionAnnotationStatisticSummaryListStatisticSummaryRunIdentifierStatisticModelResult -  작업  -StartDataQualityRulesetEvaluationRun (시작_데이터_품질_규칙 세트_평가_실행)CancelDataQualityRulesetEvaluationRun (취소_데이터_품질_규칙 세트_평가_실행)GetDataQualityRulesetEvaluationRun (get_data_quality_rule set_valuation_run)ListDataQualityRulesetEvaluationRuns (목록_데이터_품질_규칙 세트_평가_실행)StartDataQualityRuleRecommendationRun (시작_데이터_품질_규칙_권장_실행)CancelDataQualityRuleRecommendationRun (취소_데이터_품질_규칙_권장_실행)GetDataQualityRuleRecommendationRun (get_data_quality_Rule_Recommendation_run)ListDataQualityRuleRecommendationRuns (목록_데이터_품질_규칙_권장_실행)GetDataQualityResult (데이터_품질_결과 가져오기)BatchGetDataQualityResult (배치_가져오기_데이터_품질_결과)ListDataQualityResults (목록_데이터_품질_결과)CreateDataQualityRuleset (데이터_품질_규칙 세트 생성하기)DeleteDataQualityRuleset (데이터_품질_규칙 세트 삭제)GetDataQualityRuleset (get_data_quality_rule set)ListDataQualityRulesets (목록_데이터_품질_규칙 세트)UpdateDataQualityRuleset (업데이트_데이터_품질_규칙 세트)ListDataQualityStatistics (목록_데이터_품질_통계)TimestampFilterCreateDataQualityRulesetRequestGetDataQualityRulesetResponseGetDataQualityResultResponseStartDataQualityRuleRecommendationRunRequestGetDataQualityRuleRecommendationRunResponseBatchPutDataQualityStatisticAnnotation (배치_퍼팅_데이터_품질_통계_주석)GetDataQualityModel (get_data_quality_model)GetDataQualityModelResult (데이터_품질_모델_결과 가져오기)ListDataQualityStatisticAnnotations (목록_데이터_품질_통계_주석)PutDataQualityProfileAnnotation (데이터_품질_프로필_주석 넣기)

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 품질 API

데이터 품질은 데이터 품질 데이터 유형을 API 설명하며 데이터 품질 규칙 세트, 실행 및 평가를 생성, 삭제 또는 업데이트하기 API 위한 유형을 포함합니다.

데이터 타입

DataSource 구조

데이터 품질 결과를 원하는 데이터 소스 ( AWS Glue 테이블).

필드
  • GlueTable필수: GlueTable 객체입니다.

    AWS Glue 테이블.

DataQualityRulesetListDetails 구조

GetDataQualityRuleset에서 반환되는 데이터 품질 규칙 세트를 설명합니다.

필드
  • Name— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    데이터 품질 규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    데이터 품질 규칙 세트에 대한 설명입니다.

  • CreatedOn – 타임스탬프입니다.

    데이터 품질 규칙 세트가 생성된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    데이터 품질 규칙 세트가 마지막으로 수정된 날짜와 시간입니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    테이블을 나타내는 객체. AWS Glue

  • RecommendationRunId— 와 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    권장 실행에서 규칙 세트가 생성되면 이 실행 ID가 생성되어 두 규칙을 서로 연결합니다.

  • RuleCount - 숫자(정수)입니다.

    규칙 세트의 규칙 수입니다.

DataQualityTargetTable 구조체

AWS Glue 테이블을 나타내는 객체.

필드
  • TableName필수: UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    테이블 이름. AWS Glue

  • DatabaseName필수: UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    테이블이 있는 데이터베이스의 AWS Glue 이름.

  • CatalogId— 와 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    테이블이 있는 카탈로그 ID입니다. AWS Glue

DataQualityRulesetEvaluationRunDescription 구조

데이터 품질 규칙 세트 평가 실행 결과를 설명합니다.

필드
  • RunId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

  • Status— UTF -8 문자열 (유효한 값: STARTING | | | | | RUNNING | STOPPING STOPPED |SUCCEEDED). FAILED TIMEOUT

    이 실행의 상태입니다.

  • StartedOn – 타임스탬프입니다.

    실행이 시작된 날짜와 시간입니다.

  • DataSourceDataSource 객체입니다.

    실행과 관련된 데이터 소스 ( AWS Glue 테이블).

DataQualityRulesetEvaluationRunFilter 구조

필터 기준입니다.

필드
  • DataSource필수: DataSource 객체입니다.

    실행과 관련된 데이터 소스 ( AWS Glue 테이블) 를 기반으로 필터링합니다.

  • StartedBefore – 타임스탬프입니다.

    이 시간 이전에 시작된 실행을 기준으로 결과를 필터링합니다.

  • StartedAfter – 타임스탬프입니다.

    이 시간 이후에 시작된 실행을 기준으로 결과를 필터링합니다.

DataQualityEvaluationRunAdditionalRunOptions 구조

평가 실행에 대해 지정할 수 있는 추가 실행 옵션입니다.

필드
  • CloudWatchMetricsEnabled – 부울입니다.

    CloudWatch 메트릭 활성화 여부.

  • ResultsS3Prefix— UTF -8 문자열.

    결과를 저장할 Amazon S3의 접두사입니다.

  • CompositeRuleEvaluationMethod— UTF -8 문자열 (유효한 값: COLUMN |ROW).

    규칙 세트의 복합 규칙 평가 방법을 /로 설정합니다. ROW COLUMN

DataQualityRuleRecommendationRunDescription 구조

데이터 품질 규칙 권장 실행 결과를 설명합니다.

필드
  • RunId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

  • Status— UTF -8 문자열 (유효한 값: STARTING | | | | | RUNNING | STOPPING STOPPED |SUCCEEDED). FAILED TIMEOUT

    이 실행의 상태입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • DataSourceDataSource 객체입니다.

    권장 사항 실행과 관련된 데이터 소스 (AWS Glue 테이블).

DataQualityRuleRecommendationRunFilter 구조

데이터 품질 권장 실행을 나열하기 위한 필터입니다.

필드
  • DataSource필수: DataSource 객체입니다.

    지정된 데이터 소스 (AWS Glue 테이블) 를 기반으로 필터링합니다.

  • StartedBefore – 타임스탬프입니다.

    제공된 시간 이전에 시작된 결과에 대한 시간을 기준으로 필터링합니다.

  • StartedAfter – 타임스탬프입니다.

    제공된 시간 이후에 시작된 결과에 대한 시간을 기준으로 필터링합니다.

DataQualityResult 구조

데이터 품질 결과를 설명합니다.

필드
  • ResultId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    데이터 품질 결과의 고유한 결과 ID입니다.

  • ProfileId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과의 프로필 ID입니다.

  • Score – 1.0 이하의 숫자(실수)입니다.

    집계된 데이터 품질 점수입니다. 총 규칙 수에 전달된 규칙의 비율을 나타냅니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블입니다(있는 경우).

  • RulesetName— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 규칙 세트의 이름입니다.

  • EvaluationContext— -8 문자열UTF.

    AWS Glue Studio의 작업 컨텍스트에서 캔버스의 각 노드에는 일반적으로 일종의 이름이 할당되며 데이터 품질 노드에는 이름이 지정됩니다. 여러 노드의 경우 evaluationContext에서 노드를 구분할 수 있습니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 실행이 시작된 날짜와 시간입니다.

  • CompletedOn – 타임스탬프입니다.

    이 데이터 품질 실행이 완료된 날짜와 시간입니다.

  • JobName— UTF 다음과 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    데이터 품질 결과와 연결된 작업 이름입니다(있는 경우).

  • JobRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 작업 실행 ID입니다(있는 경우).

  • RulesetEvaluationRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    이 데이터 품질 결과에 대한 규칙 세트 평가의 고유한 실행 ID입니다.

  • RuleResultsDataQualityRuleResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 규칙의 결과를 나타내는 DataQualityRuleResult 객체 목록입니다.

  • AnalyzerResultsDataQualityAnalyzerResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 분석기의 결과를 나타내는 DataQualityAnalyzerResult 객체의 목록입니다.

  • ObservationsDataQualityObservation 객체의 배열이며 구조는 50개 이하입니다.

    규칙과 분석기를 평가한 후 생성된 관찰을 나타내는 DataQualityObservation 객체의 목록입니다.

DataQualityAnalyzerResult 구조체

데이터 품질 분석기의 평가 결과를 설명합니다.

필드
  • Name— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    데이터 품질 분석기의 이름입니다.

  • Description— UTF 일치하는 -8 문자열, 2048바이트 이하 URI address multi-line string pattern

    데이터 품질 분석기에 대한 설명입니다.

  • EvaluationMessage— UTF -8 문자열, 길이가 2048바이트를 넘지 않아야 하며 다음과 일치합니다. URI address multi-line string pattern

    평가 메시지입니다.

  • EvaluatedMetrics – 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 255바이트 이상의 UTF -8 문자열이며 다음과 일치합니다. Single-line string pattern

    각 값은 숫자(double)입니다.

    분석기 평가와 관련된 지표의 맵입니다.

DataQualityObservation 구조

규칙과 분석기를 평가한 후 생성된 관찰을 설명합니다.

필드
  • Description— UTF -8 문자열, 길이 2048바이트 이하, 다음과 일치합니다. URI address multi-line string pattern

    데이터 품질 관찰에 대한 설명입니다.

  • MetricBasedObservationMetricBasedObservation 객체입니다.

    평가된 데이터 품질 지표를 기반으로 하는 관찰을 나타내는 MetricBasedObservation 유형의 객체입니다.

MetricBasedObservation 구조체

평가된 데이터 품질 지표를 기반으로 생성된 지표 기반 관찰을 설명합니다.

필드
  • MetricName— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    관찰을 생성하는 데 사용된 데이터 품질 지표의 이름입니다.

  • StatisticId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    통계 ID입니다.

  • MetricValuesDataQualityMetricValues 객체입니다.

    데이터 품질 지표 값의 분석을 나타내는 유형 DataQualityMetricValues의 객체입니다.

  • NewRules— -8개의 문자열로 구성된 배열. UTF

    데이터 품질 지표 값을 기반으로 관찰의 일부로 생성된 새 데이터 품질 규칙의 목록입니다.

DataQualityMetricValues 구조

과거 데이터 분석에 따른 데이터 품질 지표 값을 설명합니다.

필드
  • ActualValue - 숫자(double)입니다.

    데이터 품질 지표의 실제 값입니다.

  • ExpectedValue - 숫자(double)입니다.

    과거 데이터 분석에 따른 데이터 품질 지표의 예상 값입니다.

  • LowerLimit - 숫자(double)입니다.

    과거 데이터 분석에 따른 데이터 품질 지표 값의 하한입니다.

  • UpperLimit - 숫자(double)입니다.

    과거 데이터 분석에 따른 데이터 품질 지표 값의 상한입니다.

DataQualityRuleResult 구조

데이터 품질 규칙 평가 결과를 설명합니다.

필드
  • Name— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    데이터 품질 규칙의 이름입니다.

  • Description— UTF 일치하는 -8 문자열, 2048바이트 이하 URI address multi-line string pattern

    데이터 품질 규칙에 대한 설명입니다.

  • EvaluationMessage— UTF -8 문자열, 길이가 2048바이트를 넘지 않아야 하며 다음과 일치합니다. URI address multi-line string pattern

    평가 메시지입니다.

  • Result— UTF -8 문자열 (유효한 값: PASS | |). FAIL ERROR

    규칙의 통과 또는 실패 상태입니다.

  • EvaluatedMetrics – 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 255바이트 이상의 UTF -8 문자열이며 다음과 일치합니다. Single-line string pattern

    각 값은 숫자(double)입니다.

    규칙 평가와 관련된 지표 맵입니다.

  • EvaluatedRule— 2048바이트를 넘지 않는 UTF -8개의 문자열로, 다음과 일치합니다. URI address multi-line string pattern

    평가된 규칙입니다.

DataQualityResultDescription 구조체

데이터 품질 결과를 설명합니다.

필드
  • ResultId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    이 데이터 품질 결과의 고유한 결과 ID입니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블 이름입니다.

  • JobName— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 작업 이름입니다.

  • JobRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 작업 실행 ID입니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 시작된 시간입니다.

DataQualityResultFilterCriteria 구조체

데이터 품질 결과를 반환하는 데 사용되는 기준입니다.

필드
  • DataSourceDataSource 객체입니다.

    지정된 데이터 소스별로 결과를 필터링합니다. AWS Glue 테이블에 대한 모든 결과를 검색하는 경우를 예로 들 수 있습니다.

  • JobName— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    지정된 작업 이름을 기준으로 결과를 필터링합니다.

  • JobRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    지정된 작업 실행 ID를 기준으로 결과를 필터링합니다.

  • StartedAfter – 타임스탬프입니다.

    이 시간 이후에 시작된 실행을 기준으로 결과를 필터링합니다.

  • StartedBefore – 타임스탬프입니다.

    이 시간 이전에 시작된 실행을 기준으로 결과를 필터링합니다.

DataQualityRulesetFilterCriteria 구조체

데이터 품질 규칙 세트를 필터링하는 데 사용되는 기준입니다.

필드
  • Name— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    규칙 세트 필터 기준의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트 필터 기준에 대한 설명입니다.

  • CreatedBefore – 타임스탬프입니다.

    이 날짜 이전에 생성된 규칙 세트에서 필터링합니다.

  • CreatedAfter – 타임스탬프입니다.

    이 날짜 이후에 생성된 규칙 세트에서 필터링합니다.

  • LastModifiedBefore – 타임스탬프입니다.

    이 날짜 이전에 마지막으로 수정된 규칙 세트에서 필터링합니다.

  • LastModifiedAfter – 타임스탬프입니다.

    이 날짜 이후에 마지막으로 수정된 규칙 세트에서 필터링합니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    대상 테이블의 이름 및 데이터베이스 이름입니다.

StatisticAnnotation 구조체

통계 주석.

필드
  • ProfileId— UTF 다음과 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    프로필 ID.

  • StatisticId— UTF 다음과 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    통계 ID입니다.

  • StatisticRecordedOn – 타임스탬프입니다.

    주석이 달린 통계가 기록된 시점의 타임스탬프입니다.

  • InclusionAnnotationTimestampedInclusionAnnotation 객체입니다.

    포함 주석이 통계에 적용되었습니다.

TimestampedInclusionAnnotation 구조

타임스탬프가 찍힌 포함 주석.

필드
  • Value— UTF -8 문자열 (유효한 값: |). INCLUDE EXCLUDE

    포함 주석 값입니다.

  • LastModifiedOn – 타임스탬프입니다.

    포함 주석이 마지막으로 수정된 시점의 타임스탬프입니다.

AnnotationError 구조

실패한 주석.

필드
  • ProfileId— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    실패한 주석의 프로필 ID입니다.

  • StatisticId— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    실패한 주석의 통계 ID입니다.

  • FailureReasonURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    주석이 실패한 이유.

DatapointInclusionAnnotation 구조

포함 주석.

필드
  • ProfileId— UTF 다음과 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    통계가 속하는 데이터 품질 프로필의 ID.

  • StatisticId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    통계 ID입니다.

  • InclusionAnnotation— UTF -8 문자열 (유효한 값: |). INCLUDE EXCLUDE

    통계에 적용할 포함 주석 값입니다.

StatisticSummaryList 목록

StatisticSummary 목록.

StatisticSummary 객체 어레이.

StatisticSummary 목록.

StatisticSummary 구조

통계에 대한 요약 정보.

필드
  • StatisticId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    통계 ID입니다.

  • ProfileId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    프로필 ID.

  • RunIdentifierRunIdentifier 객체입니다.

    실행 식별자

  • StatisticName— 와 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Custom string pattern #32

    통계의 이름.

  • DoubleValue - 숫자(double)입니다.

    통계의 값입니다.

  • EvaluationLevel— UTF -8 문자열 (유효한 값: Dataset="DATASET" | Column="COLUMN" |Multicolumn="MULTICOLUMN").

    통계의 평가 수준. 가능한 값:Dataset,Column,Multicolumn.

  • ColumnsReferenced— UTF -8개의 문자열로 구성된 배열.

    통계에서 참조한 열 목록.

  • ReferencedDatasets— UTF -8개의 문자열로 구성된 배열.

    통계에서 참조한 데이터셋 목록.

  • StatisticProperties – 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 255바이트 이상의 UTF -8 문자열이며 다음과 일치합니다. Single-line string pattern

    각 값은 URI address multi-line string pattern와 일치하는 설명 문자열(2,048바이트 이하)입니다.

    A는 a와 StatisticPropertiesMap 를 포함합니다. NameString DescriptionString

  • RecordedOn – 타임스탬프입니다.

    통계가 기록된 타임스탬프.

  • InclusionAnnotationTimestampedInclusionAnnotation 객체입니다.

    통계에 대한 포함 주석.

RunIdentifier 구조체

실행 식별자.

필드
  • RunId— 와 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    실행 ID.

  • JobRunId— UTF 다음과 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    작업 실행 ID.

StatisticModelResult 구조

통계 모델 결과.

필드
  • LowerBound - 숫자(double)입니다.

    하한입니다.

  • UpperBound - 숫자(double)입니다.

    상한선.

  • PredictedValue - 숫자(double)입니다.

    예측 값입니다.

  • ActualValue - 숫자(double)입니다.

    실제 값입니다.

  • Date – 타임스탬프입니다.

    날짜.

  • InclusionAnnotation— UTF -8 문자열 (유효한 값: INCLUDE |EXCLUDE).

    포함 주석.

운영

StartDataQualityRulesetEvaluationRun 액션 (Python: 시작_데이터_품질_규칙 세트_평가_실행)

규칙 세트 정의 (권장 또는 사용자 정의 정의) 가 있으면 이 작업을 호출하여 데이터 소스 (테이블) 를 기준으로 규칙 세트를 평가합니다.AWS Glue 평가 시 결과를 계산하여 를 사용하여 검색할 수 있습니다. GetDataQualityResult API

요청
  • DataSource필수(Required): DataSource 객체입니다.

    이 실행과 관련된 데이터 소스 (AWS Glue 테이블)

  • Role필수: UTF -8 문자열.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • ClientToken— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    항등성에 사용되며 동일한 리소스의 여러 인스턴스를 만들거나 시작하지 않도록 임의의 ID (예: aUUID) 로 설정하는 것이 좋습니다.

  • AdditionalRunOptionsDataQualityEvaluationRunAdditionalRunOptions 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 실행 옵션입니다.

  • RulesetNames필수: UTF -8개의 문자열 배열, 1개 이상 또는 10개 이상의 문자열.

    규칙 세트 이름의 목록입니다.

  • AdditionalDataSources – 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 255바이트 이상의 UTF -8 문자열이며 다음과 일치합니다. Single-line string pattern

    각 값은 DataSource 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 데이터 소스에 대한 참조 문자열의 맵입니다.

응답
  • RunId— UTF 일치하는 -8개의 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

Errors
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRulesetEvaluationRun 액션 (Python: 취소_데이터_품질_규칙 세트_평가_실행)

데이터 소스에 대해 규칙 세트를 평가 중인 실행을 취소합니다.

요청
  • RunId필수: 다음과 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRulesetEvaluationRun 액션 (Python: get_data_quality_ruleset_valuation_run)

데이터 소스에 대해 규칙 세트를 평가하는 특정 실행을 검색합니다.

요청
  • RunId필수: 다음과 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

응답
  • RunId— UTF 다음과 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

  • DataSourceDataSource 객체입니다.

    이 평가 실행과 관련된 데이터 소스 ( AWS Glue 테이블)

  • Role— UTF -8 문자열.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • AdditionalRunOptionsDataQualityEvaluationRunAdditionalRunOptions 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 실행 옵션입니다.

  • Status— UTF -8 문자열 (유효한 값: STARTING | | | RUNNING | STOPPING | STOPPED | SUCCEEDED FAILED |TIMEOUT).

    이 실행의 상태입니다.

  • ErrorString— UTF -8 문자열.

    실행과 연결된 오류 문자열입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 권장 실행이 수정된 마지막 시점입니다.

  • CompletedOn – 타임스탬프입니다.

    이 실행이 완료된 날짜와 시간입니다.

  • ExecutionTime - 숫자(정수)입니다.

    이 실행이 리소스를 사용한 시간(초)입니다.

  • RulesetNames— UTF -8개의 문자열로 구성된 배열, 1개 이상 또는 10개 이상의 문자열

    실행에 대한 규칙 세트 이름 목록입니다. 현재 이 파라미터는 하나의 규칙 집합 이름만 사용합니다.

  • ResultIds— 1개 또는 10개 이상의 문자열로 구성된 UTF -8개 문자열 배열.

    IDs실행에 대한 데이터 품질 결과의 결과 목록.

  • AdditionalDataSources – 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 255바이트 이상의 UTF -8 문자열이며 다음과 일치합니다. Single-line string pattern

    각 값은 DataSource 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 데이터 소스에 대한 참조 문자열의 맵입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesetEvaluationRuns 액션 (Python: 목록_데이터_품질_규칙 세트_평가_실행)

규칙 세트가 데이터 소스에 대해 평가되는 필터 조건을 충족하는 모든 실행을 나열합니다.

요청
  • FilterDataQualityRulesetEvaluationRunFilter 객체입니다.

    필터 기준입니다.

  • NextTokenUTF— -8 문자열.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

응답
  • RunsDataQualityRulesetEvaluationRunDescription 객체의 배열입니다.

    데이터 품질 규칙 세트 실행을 나타내는 DataQualityRulesetEvaluationRunDescription 객체 목록입니다.

  • NextToken— UTF -8 문자열.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartDataQualityRuleRecommendationRun 액션 (Python: 시작_데이터_품질_규칙_권장_실행)

어떤 규칙을 작성해야 할지 모를 경우 규칙을 생성하는 데 사용되는 권장 사항 실행을 시작합니다. AWS Glue Data Quality는 데이터를 분석하고 잠재적 규칙 세트에 대한 권장 사항을 제시합니다. 그런 다음 규칙 세트를 분류하고 생성된 규칙 세트를 원하는 대로 수정할 수 있습니다.

권장 사항 실행은 90일 후에 자동으로 삭제됩니다.

요청

데이터 품질 규칙 권장 사항 요청.

  • DataSource필수(Required): DataSource 객체입니다.

    이 실행과 관련된 데이터 소스 (AWS Glue 테이블).

  • Role필수: UTF -8 문자열.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • CreatedRulesetName— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    규칙 세트의 이름입니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientToken— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    항등성에 사용되며 동일한 리소스의 여러 인스턴스를 만들거나 시작하지 않도록 임의의 ID (예: aUUID) 로 설정하는 것이 좋습니다.

응답
  • RunId— UTF 다음과 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRuleRecommendationRun 조치 (Python: 취소_데이터_품질_규칙_권장_실행)

규칙을 생성하는 데 사용된 지정된 권장 실행을 취소합니다.

요청
  • RunId필수: 다음과 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleRecommendationRun 액션 (Python: get_data_품질_규칙_권장_실행)

규칙을 생성하는 데 사용된 지정된 권장 실행을 가져옵니다.

요청
  • RunId필수: 다음과 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

응답

데이터 품질 규칙 권장 사항 실행에 대한 응답입니다.

  • RunId— UTF -8개의 문자열, 1바이트 이상 또는 255바이트 이상, 다음과 일치해야 합니다. Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

  • DataSourceDataSource 객체입니다.

    이 실행과 관련된 데이터 소스 ( AWS Glue 테이블)

  • Role— UTF -8 문자열.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • Status— UTF -8 문자열 (유효한 값: STARTING | | | RUNNING | STOPPING | STOPPED | SUCCEEDED FAILED |TIMEOUT).

    이 실행의 상태입니다.

  • ErrorString— UTF -8 문자열.

    실행과 연결된 오류 문자열입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 권장 실행이 수정된 마지막 시점입니다.

  • CompletedOn – 타임스탬프입니다.

    이 실행이 완료된 날짜와 시간입니다.

  • ExecutionTime - 숫자(정수)입니다.

    이 실행이 리소스를 사용한 시간(초)입니다.

  • RecommendedRuleset— UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    시작 규칙 권장 실행이 완료되면 권장 규칙 세트(규칙 세트)가 생성됩니다. 이 멤버는 이러한 규칙을 데이터 품질 정의 언어 () 형식으로 사용합니다. DQDL

  • CreatedRulesetName— UTF -8 문자열로, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    실행에서 생성된 규칙 세트의 이름입니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRuleRecommendationRuns 액션 (Python: 목록_데이터_품질_규칙_권장_실행)

필터 기준에 맞는 권장 실행을 나열합니다.

요청
  • FilterDataQualityRuleRecommendationRunFilter 객체입니다.

    필터 기준입니다.

  • NextTokenUTF— -8 문자열.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

응답
  • RunsDataQualityRuleRecommendationRunDescription 객체의 배열입니다.

    DataQualityRuleRecommendationRunDescription 객체의 목록.

  • NextToken— UTF -8 문자열.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityResult 액션 (Python: 데이터_품질_결과 가져오기)

데이터 품질 규칙 평가 결과를 검색합니다.

요청
  • ResultId필수: UTF -8 문자열로, 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    데이터 품질 결과의 고유한 결과 ID입니다.

응답

데이터 품질 결과에 대한 응답.

  • ResultId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    데이터 품질 결과의 고유한 결과 ID입니다.

  • ProfileId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과의 프로필 ID입니다.

  • Score – 1.0 이하의 숫자(실수)입니다.

    집계된 데이터 품질 점수입니다. 총 규칙 수에 전달된 규칙의 비율을 나타냅니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블입니다(있는 경우).

  • RulesetName— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 규칙 세트의 이름입니다.

  • EvaluationContext— -8 문자열UTF.

    AWS Glue Studio의 작업 컨텍스트에서 캔버스의 각 노드에는 일반적으로 일종의 이름이 할당되며 데이터 품질 노드에는 이름이 지정됩니다. 여러 노드의 경우 evaluationContext에서 노드를 구분할 수 있습니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 시작된 날짜와 시간입니다.

  • CompletedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 완료된 날짜와 시간입니다.

  • JobName— UTF 다음과 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    데이터 품질 결과와 연결된 작업 이름입니다(있는 경우).

  • JobRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 작업 실행 ID입니다(있는 경우).

  • RulesetEvaluationRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    규칙 세트 평가와 연결된 고유한 실행 ID입니다.

  • RuleResultsDataQualityRuleResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 규칙의 결과를 나타내는 DataQualityRuleResult 객체 목록입니다.

  • AnalyzerResultsDataQualityAnalyzerResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 분석기의 결과를 나타내는 DataQualityAnalyzerResult 객체의 목록입니다.

  • ObservationsDataQualityObservation 객체의 배열이며 구조는 50개 이하입니다.

    규칙과 분석기를 평가한 후 생성된 관찰을 나타내는 DataQualityObservation 객체의 목록입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • EntityNotFoundException

BatchGetDataQualityResult 액션 (Python: 배치_가져오기_데이터_품질_결과)

지정된 결과에 대한 데이터 품질 결과 목록을 검색합니다. IDs

요청
  • ResultIds필수: 1개 또는 100개 이상의 문자열로 구성된 UTF -8개 문자열 배열.

    데이터 품질 IDs 결과의 고유 결과 목록.

응답
  • Results필수(Required): DataQualityResult 객체의 배열입니다.

    데이터 품질 결과를 나타내는 DataQualityResult 객체 목록입니다.

  • ResultsNotFound— 1개 이상 또는 100개 이상의 UTF -8개 문자열로 구성된 배열.

    결과를 찾을 IDs 수 없는 결과 목록.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityResults 액션 (Python: 목록_데이터_품질_결과)

계정의 모든 데이터 품질 실행 결과를 반환합니다.

요청
  • FilterDataQualityResultFilterCriteria 객체입니다.

    필터 기준입니다.

  • NextTokenUTF— -8 문자열.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

응답
  • Results필수(Required): DataQualityResultDescription 객체의 배열입니다.

    DataQualityResultDescription 객체의 목록.

  • NextToken— UTF -8 문자열.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

CreateDataQualityRuleset 액션 (Python: 생성_데이터_품질_규칙 세트)

지정된 테이블에 규칙이 적용된 데이터 품질 규칙 세트를 만듭니다. DQDL AWS Glue

데이터 품질 정의 언어 () 를 사용하여 규칙 세트를 생성합니다. DQDL 자세한 내용은 AWS Glue 개발자 안내서를 참조하십시오.

요청

데이터 품질 규칙 세트 생성 요청.

  • Name필수: 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    데이터 품질 규칙 세트의 고유한 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    데이터 품질 규칙 세트에 대한 설명입니다.

  • Ruleset필수: UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    데이터 품질 정의 언어 () 규칙 세트. DQDL 자세한 내용은 AWS Glue 개발자 안내서를 참조하십시오.

  • Tags – 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 128바이트 이상인 UTF -8 문자열입니다.

    각 값은 길이가 UTF 256바이트를 넘지 않는 -8 문자열입니다.

    데이터 품질 규칙 세트에 적용된 태그 목록입니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    데이터 품질 규칙 세트와 연결된 대상 테이블입니다.

  • RecommendationRunId— UTF 다음과 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    권장 실행의 고유한 실행 ID입니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientToken— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    항등성에 사용되며 동일한 리소스의 여러 인스턴스를 만들거나 시작하지 않도록 임의의 ID (예: aUUID) 로 설정하는 것이 좋습니다.

응답
  • Name— UTF 다음과 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    데이터 품질 규칙 세트의 고유한 이름입니다.

Errors
  • InvalidInputException

  • AlreadyExistsException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

DeleteDataQualityRuleset 액션 (Python: 데이터_품질_규칙 세트 삭제)

데이터 품질 규칙 세트를 삭제합니다.

요청
  • Name필수: UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    데이터 품질 규칙 세트의 이름입니다.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleset 액션 (Python: get_data_quality_ruleset)

식별자 또는 이름을 기준으로 기존 규칙 세트를 반환합니다.

요청
  • Name필수: UTF -8 문자열로, 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    규칙 세트의 이름입니다.

응답

데이터 품질 규칙 세트 응답을 반환합니다.

  • Name— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset— UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    데이터 품질 정의 언어 () 규칙 세트. DQDL 자세한 내용은 AWS Glue 개발자 안내서를 참조하십시오.

  • TargetTableDataQualityTargetTable 객체입니다.

    대상 테이블의 이름 및 데이터베이스 이름입니다.

  • CreatedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 생성된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 수정된 마지막 시점입니다.

  • RecommendationRunId— 와 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    권장 실행에서 규칙 세트가 생성되면 이 실행 ID가 생성되어 두 규칙을 서로 연결합니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesets 액션 (Python: 목록_데이터_품질_규칙 세트)

지정된 테이블 목록에 대해 페이지별로 구분된 규칙 세트 목록을 반환합니다. AWS Glue

요청
  • NextToken— -8 문자열UTF.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

  • FilterDataQualityRulesetFilterCriteria 객체입니다.

    필터 기준입니다.

  • Tags – 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 128바이트 이상인 UTF -8 문자열입니다.

    각 값은 길이가 UTF 256바이트를 넘지 않는 -8 문자열입니다.

    키-값 페어 태그의 목록입니다.

응답
  • RulesetsDataQualityRulesetListDetails 객체의 배열입니다.

    지정된 테이블 목록에 대한 규칙 세트를 페이지로 나눈 목록입니다. AWS Glue

  • NextToken— -8 문자열UTF.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

UpdateDataQualityRuleset 액션 (Python: 업데이트_데이터_품질_규칙 세트)

지정된 데이터 품질 규칙 세트를 업데이트합니다.

요청
  • Name필수: UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    데이터 품질 규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset— UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    데이터 품질 정의 언어 () 규칙 세트. DQDL 자세한 내용은 AWS Glue 개발자 안내서를 참조하십시오.

응답
  • Name— 와 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    데이터 품질 규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset— UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    데이터 품질 정의 언어 () 규칙 세트. DQDL 자세한 내용은 AWS Glue 개발자 안내서를 참조하십시오.

Errors
  • EntityNotFoundException

  • AlreadyExistsException

  • IdempotentParameterMismatchException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

ListDataQualityStatistics 액션 (Python: 목록_데이터_품질_통계)

데이터 품질 통계 목록을 검색합니다.

요청
  • StatisticId— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    통계 ID입니다.

  • ProfileId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    프로필 ID.

  • TimestampFilterTimestampFilter 객체입니다.

    타임스탬프 필터.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    이 요청에서 반환할 최대 결과 수입니다.

  • NextToken— UTF -8 문자열.

    결과의 다음 페이지를 요청하기 위한 페이지 매김 토큰.

응답
  • StatisticsStatisticSummary 객체의 배열입니다.

    StatisticSummaryList.

  • NextToken— UTF -8 문자열.

    결과의 다음 페이지를 요청하기 위한 페이지 매김 토큰.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

TimestampFilter 구조

타임스탬프 필터.

필드
  • RecordedBefore – 타임스탬프입니다.

    통계가 결과에 포함되어야 하는 시점의 타임스탬프입니다.

  • RecordedAfter – 타임스탬프입니다.

    통계가 결과에 포함되어야 하는 시점의 타임스탬프입니다.

CreateDataQualityRulesetRequest 구조

데이터 품질 규칙 세트 생성 요청.

필드
  • Name필수: 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    데이터 품질 규칙 세트의 고유한 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    데이터 품질 규칙 세트에 대한 설명입니다.

  • Ruleset필수: UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    데이터 품질 정의 언어 () 규칙 세트. DQDL 자세한 내용은 AWS Glue 개발자 안내서를 참조하십시오.

  • Tags – 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.

    각 키는 1바이트 이상 또는 128바이트 이상인 UTF -8 문자열입니다.

    각 값은 길이가 UTF 256바이트를 넘지 않는 -8 문자열입니다.

    데이터 품질 규칙 세트에 적용된 태그 목록입니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    데이터 품질 규칙 세트와 연결된 대상 테이블입니다.

  • RecommendationRunId— UTF 다음과 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    권장 실행의 고유한 실행 ID입니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientToken— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    항등성에 사용되며 동일한 리소스의 여러 인스턴스를 만들거나 시작하지 않도록 임의의 ID (예: aUUID) 로 설정하는 것이 좋습니다.

GetDataQualityRulesetResponse 구조

데이터 품질 규칙 세트 응답을 반환합니다.

필드
  • Name— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset— UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    데이터 품질 정의 언어 () 규칙 세트. DQDL 자세한 내용은 AWS Glue 개발자 안내서를 참조하십시오.

  • TargetTableDataQualityTargetTable 객체입니다.

    대상 테이블의 이름 및 데이터베이스 이름입니다.

  • CreatedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 생성된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 수정된 마지막 시점입니다.

  • RecommendationRunId— 와 일치하는 UTF -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    권장 실행에서 규칙 세트가 생성되면 이 실행 ID가 생성되어 두 규칙을 서로 연결합니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

GetDataQualityResultResponse 구조체

데이터 품질 결과에 대한 응답.

필드
  • ResultId— UTF -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치합니다. Single-line string pattern

    데이터 품질 결과의 고유한 결과 ID입니다.

  • ProfileId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과의 프로필 ID입니다.

  • Score – 1.0 이하의 숫자(실수)입니다.

    집계된 데이터 품질 점수입니다. 총 규칙 수에 전달된 규칙의 비율을 나타냅니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블입니다(있는 경우).

  • RulesetName— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 규칙 세트의 이름입니다.

  • EvaluationContext— -8 문자열UTF.

    AWS Glue Studio의 작업 컨텍스트에서 캔버스의 각 노드에는 일반적으로 일종의 이름이 할당되며 데이터 품질 노드에는 이름이 지정됩니다. 여러 노드의 경우 evaluationContext에서 노드를 구분할 수 있습니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 시작된 날짜와 시간입니다.

  • CompletedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 완료된 날짜와 시간입니다.

  • JobName— UTF 다음과 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    데이터 품질 결과와 연결된 작업 이름입니다(있는 경우).

  • JobRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 결과와 연결된 작업 실행 ID입니다(있는 경우).

  • RulesetEvaluationRunId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    규칙 세트 평가와 연결된 고유한 실행 ID입니다.

  • RuleResultsDataQualityRuleResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 규칙의 결과를 나타내는 DataQualityRuleResult 객체 목록입니다.

  • AnalyzerResultsDataQualityAnalyzerResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 분석기의 결과를 나타내는 DataQualityAnalyzerResult 객체의 목록입니다.

  • ObservationsDataQualityObservation 객체의 배열이며 구조는 50개 이하입니다.

    규칙과 분석기를 평가한 후 생성된 관찰을 나타내는 DataQualityObservation 객체의 목록입니다.

StartDataQualityRuleRecommendationRunRequest 구조체

데이터 품질 규칙 권장 사항 요청.

필드
  • DataSource필수: DataSource 객체입니다.

    이 실행과 관련된 데이터 소스 (AWS Glue 테이블).

  • Role필수: UTF -8 문자열.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • CreatedRulesetName— 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    규칙 세트의 이름입니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientToken— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    항등성에 사용되며 동일한 리소스의 여러 인스턴스를 만들거나 시작하지 않도록 임의의 ID (예: aUUID) 로 설정하는 것이 좋습니다.

GetDataQualityRuleRecommendationRunResponse 구조

데이터 품질 규칙 권장 사항 실행에 대한 응답입니다.

필드
  • RunId— UTF -8개의 문자열, 1바이트 이상 또는 255바이트 이상, 다음과 일치해야 합니다. Single-line string pattern

    이 실행과 연결된 고유의 실행 식별자입니다.

  • DataSourceDataSource 객체입니다.

    이 실행과 관련된 데이터 소스 ( AWS Glue 테이블)

  • Role— UTF -8 문자열.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • Status— UTF -8 문자열 (유효한 값: STARTING | | | RUNNING | STOPPING | STOPPED | SUCCEEDED FAILED |TIMEOUT).

    이 실행의 상태입니다.

  • ErrorString— UTF -8 문자열.

    실행과 연결된 오류 문자열입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 권장 실행이 수정된 마지막 시점입니다.

  • CompletedOn – 타임스탬프입니다.

    이 실행이 완료된 날짜와 시간입니다.

  • ExecutionTime - 숫자(정수)입니다.

    이 실행이 리소스를 사용한 시간(초)입니다.

  • RecommendedRuleset— UTF -8 문자열, 1바이트 이상 또는 65536바이트 이상

    시작 규칙 권장 실행이 완료되면 권장 규칙 세트(규칙 세트)가 생성됩니다. 이 멤버는 이러한 규칙을 데이터 품질 정의 언어 () 형식으로 사용합니다. DQDL

  • CreatedRulesetName— UTF -8 문자열로, 길이가 1바이트 이상 또는 255바이트 이상이어야 하며 다음과 일치해야 합니다. Single-line string pattern

    실행에서 생성된 규칙 세트의 이름입니다.

  • DataQualitySecurityConfiguration— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

BatchPutDataQualityStatisticAnnotation 액션 (Python: 배치_데이터_품질_통계_주석)

특정 데이터 품질 통계를 위해 시간 경과에 따른 데이터 포인트에 주석을 답니다.

요청
  • InclusionAnnotations필수(Required): DatapointInclusionAnnotation 객체의 배열입니다.

    의 목록. DatapointInclusionAnnotation

  • ClientToken— UTF 다음과 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    클라이언트 토큰.

응답
  • FailedInclusionAnnotationsAnnotationError 객체의 배열입니다.

    AnnotationError의 목록.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • ResourceNumberLimitExceededException

GetDataQualityModel 액션 (Python: get_data_품질_모델)

추가 정보 (,,) 와 함께 모델의 학습 상태를 검색합니다. CompletedOn StartedOn FailureReason

요청
  • StatisticId— 1바이트 이상 또는 255바이트 이상의 UTF -8문자열로, 다음과 일치합니다. Single-line string pattern

    통계 ID입니다.

  • ProfileId필수: 다음과 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    프로필 ID.

응답
  • Status— UTF -8 문자열 (유효한 값: RUNNING | SUCCEEDED |FAILED).

    데이터 품질 모델의 교육 상태.

  • StartedOn – 타임스탬프입니다.

    데이터 품질 모델 교육이 시작된 타임스탬프.

  • CompletedOn – 타임스탬프입니다.

    데이터 품질 모델 교육이 완료된 시점의 타임스탬프.

  • FailureReason— UTF -8 문자열, 1바이트 이상 또는 255바이트 이상, 과 일치해야 합니다. Single-line string pattern

    학습 실패 이유.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityModelResult 액션 (Python: 데이터_품질_모델_결과 가져오기)

지정된 프로필 ID에 대한 통계 예측을 검색합니다.

요청
  • StatisticId필수: 다음과 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    통계 ID입니다.

  • ProfileId필수: 다음과 UTF 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    프로필 ID.

응답
  • CompletedOn – 타임스탬프입니다.

    데이터 품질 모델 교육 완료 시점의 타임스탬프.

  • ModelStatisticModelResult 객체의 배열입니다.

    목록: StatisticModelResult

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityStatisticAnnotations 조치 (Python: 목록_데이터_품질_통계_주석)

데이터 품질 통계를 위한 주석을 검색합니다.

요청
  • StatisticId— UTF 일치하는 -8개의 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    통계 ID입니다.

  • ProfileId— UTF 일치하는 -8 문자열, 길이가 1바이트 이상 또는 255바이트 이상이어야 합니다. Single-line string pattern

    프로필 ID.

  • TimestampFilterTimestampFilter 객체입니다.

    타임스탬프 필터.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    이 요청에서 반환할 최대 결과 수입니다.

  • NextToken— UTF -8 문자열.

    다음 결과 세트를 검색하기 위한 페이지 매김 토큰.

응답
  • AnnotationsStatisticAnnotation 객체의 배열입니다.

    통계에 StatisticAnnotation 적용된 목록

  • NextToken— UTF -8 문자열.

    다음 결과 세트를 검색하기 위한 페이지 매김 토큰.

Errors
  • InvalidInputException

  • InternalServiceException

PutDataQualityProfileAnnotation 액션 (Python: put_data_품질_프로필_주석)

프로필의 모든 데이터포인트에 주석을 답니다.

요청
  • ProfileId필수: 와 UTF 일치하는 -8 문자열, 1바이트 이상 또는 255바이트 이상 Single-line string pattern

    주석을 추가할 데이터 품질 모니터링 프로필의 ID.

  • InclusionAnnotation필수: UTF -8 문자열 (유효한 값: INCLUDE |). EXCLUDE

    프로파일에 적용할 포함 주석 값입니다.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException