데이터 품질 API - AWS Glue
 -  데이터 유형  -DataSourceDataQualityRulesetListDetailsDataQualityTargetTableDataQualityRulesetEvaluationRunDescriptionDataQualityRulesetEvaluationRunFilterDataQualityEvaluationRunAdditionalRunOptionsDataQualityRuleRecommendationRunDescriptionDataQualityRuleRecommendationRunFilterDataQualityResultDataQualityAnalyzerResultDataQualityObservationMetricBasedObservationDataQualityMetricValuesDataQualityRuleResultDataQualityResultDescriptionDataQualityResultFilterCriteriaDataQualityRulesetFilterCriteriaStatisticAnnotationTimestampedInclusionAnnotationAnnotationErrorDatapointInclusionAnnotationStatisticSummaryListStatisticSummaryRunIdentifierStatisticModelResult -  작업  -StartDataQualityRulesetEvaluationRun(start_data_quality_ruleset_evaluation_run)CancelDataQualityRulesetEvaluationRun(cancel_data_quality_ruleset_evaluation_run)GetDataQualityRulesetEvaluationRun(get_data_quality_ruleset_evaluation_run)ListDataQualityRulesetEvaluationRuns(list_data_quality_ruleset_evaluation_runs)StartDataQualityRuleRecommendationRun(start_data_quality_rule_recommendation_run)CancelDataQualityRuleRecommendationRun(cancel_data_quality_rule_recommendation_run)GetDataQualityRuleRecommendationRun(get_data_quality_rule_recommendation_run)ListDataQualityRuleRecommendationRuns(list_data_quality_rule_recommendation_runs)GetDataQualityResult(get_data_quality_result)BatchGetDataQualityResult(batch_get_data_quality_result)ListDataQualityResults(list_data_quality_results)CreateDataQualityRuleset(create_data_quality_ruleset)DeleteDataQualityRuleset(delete_data_quality_ruleset)GetDataQualityRuleset(get_data_quality_ruleset)ListDataQualityRulesets(list_data_quality_rulesets)UpdateDataQualityRuleset(update_data_quality_ruleset)ListDataQualityStatistics(list_data_quality_statistics)TimestampFilterCreateDataQualityRulesetRequestGetDataQualityRulesetResponseGetDataQualityResultResponseStartDataQualityRuleRecommendationRunRequestGetDataQualityRuleRecommendationRunResponseBatchPutDataQualityStatisticAnnotation(batch_put_data_quality_statistic_annotation)GetDataQualityModel(get_data_quality_model)GetDataQualityModelResult(get_data_quality_model_result)ListDataQualityStatisticAnnotations(list_data_quality_statistic_annotations)PutDataQualityProfileAnnotation(put_data_quality_profile_annotation)

데이터 품질 API

데이터 품질 API는 데이터 품질 데이터 유형에 대해 설명하며 데이터 품질 규칙 세트, 실행 및 평가를 생성, 삭제 또는 업데이트하기 위한 API를 포함합니다.

데이터 타입

DataSource 구조

데이터 품질 결과를 얻으려는 데이터 소스(AWS Glue 테이블)입니다.

필드
  • GlueTable필수: GlueTable 객체입니다.

    AWS Glue 테이블

DataQualityRulesetListDetails 구조

GetDataQualityRuleset에서 반환되는 데이터 품질 규칙 세트를 설명합니다.

필드
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    데이터 품질 규칙 세트에 대한 설명입니다.

  • CreatedOn – 타임스탬프입니다.

    데이터 품질 규칙 세트가 생성된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    데이터 품질 규칙 세트가 마지막으로 수정된 날짜와 시간입니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    AWS Glue 테이블을 나타내는 객체입니다.

  • RecommendationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    권장 실행에서 규칙 세트가 생성되면 이 실행 ID가 생성되어 두 규칙을 서로 연결합니다.

  • RuleCount - 숫자(정수)입니다.

    규칙 세트의 규칙 수입니다.

DataQualityTargetTable 구조

AWS Glue 테이블을 나타내는 객체입니다.

필드
  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    AWS Glue 테이블의 이름.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    AWS Glue 테이블이 속한 데이터베이스의 이름입니다.

  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    AWS Glue 테이블이 있는 카탈로그 ID입니다.

DataQualityRulesetEvaluationRunDescription 구조

데이터 품질 규칙 세트 평가 실행 결과를 설명합니다.

필드
  • RunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

  • Status – UTF-8 문자열입니다(유효한 값: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    이 실행의 상태입니다.

  • StartedOn – 타임스탬프입니다.

    실행이 시작된 날짜와 시간입니다.

  • DataSourceDataSource 객체입니다.

    실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

DataQualityRulesetEvaluationRunFilter 구조

필터 기준입니다.

필드
  • DataSource필수: DataSource 객체입니다.

    실행과 연결된 데이터 소스(AWS Glue 테이블)를 기반으로 필터링합니다.

  • StartedBefore – 타임스탬프입니다.

    이 시간 이전에 시작된 실행을 기준으로 결과를 필터링합니다.

  • StartedAfter – 타임스탬프입니다.

    이 시간 이후에 시작된 실행을 기준으로 결과를 필터링합니다.

DataQualityEvaluationRunAdditionalRunOptions 구조

평가 실행에 대해 지정할 수 있는 추가 실행 옵션입니다.

필드
  • CloudWatchMetricsEnabled – 부울입니다.

    CloudWatch 지표를 활성화할지 여부입니다.

  • ResultsS3Prefix – UTF-8 문자열입니다.

    결과를 저장할 Amazon S3의 접두사입니다.

  • CompositeRuleEvaluationMethod – UTF-8 문자열입니다(유효한 값: COLUMN | ROW).

    규칙 세트의 복합 규칙 평가 방법을 ROW/COLUMN으로 설정합니다.

DataQualityRuleRecommendationRunDescription 구조

데이터 품질 규칙 권장 실행 결과를 설명합니다.

필드
  • RunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

  • Status – UTF-8 문자열입니다(유효한 값: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    이 실행의 상태입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • DataSourceDataSource 객체입니다.

    권장 실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

DataQualityRuleRecommendationRunFilter 구조

데이터 품질 권장 실행을 나열하기 위한 필터입니다.

필드
  • DataSource필수: DataSource 객체입니다.

    지정된 데이터 원본(AWS Glue 테이블)을 기반으로 필터링합니다.

  • StartedBefore – 타임스탬프입니다.

    제공된 시간 이전에 시작된 결과에 대한 시간을 기준으로 필터링합니다.

  • StartedAfter – 타임스탬프입니다.

    제공된 시간 이후에 시작된 결과에 대한 시간을 기준으로 필터링합니다.

DataQualityResult 구조

데이터 품질 결과를 설명합니다.

필드
  • ResultIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과의 고유한 결과 ID입니다.

  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과의 프로필 ID입니다.

  • Score – 1.0 이하의 숫자(실수)입니다.

    집계된 데이터 품질 점수입니다. 총 규칙 수에 전달된 규칙의 비율을 나타냅니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블입니다(있는 경우).

  • RulesetNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 규칙 세트의 이름입니다.

  • EvaluationContext – UTF-8 문자열입니다.

    AWS Glue Studio의 작업 컨텍스트에서 캔버스의 각 노드에는 일반적으로 일종의 이름이 할당되며 데이터 품질 노드에는 이름이 지정됩니다. 여러 노드의 경우 evaluationContext에서 노드를 구분할 수 있습니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 실행이 시작된 날짜와 시간입니다.

  • CompletedOn – 타임스탬프입니다.

    이 데이터 품질 실행이 완료된 날짜와 시간입니다.

  • JobNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 이름입니다(있는 경우).

  • JobRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 실행 ID입니다(있는 경우).

  • RulesetEvaluationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 데이터 품질 결과에 대한 규칙 세트 평가의 고유한 실행 ID입니다.

  • RuleResultsDataQualityRuleResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 규칙의 결과를 나타내는 DataQualityRuleResult 객체 목록입니다.

  • AnalyzerResultsDataQualityAnalyzerResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 분석기의 결과를 나타내는 DataQualityAnalyzerResult 객체의 목록입니다.

  • ObservationsDataQualityObservation 객체의 배열이며 구조는 50개 이하입니다.

    규칙과 분석기를 평가한 후 생성된 관찰을 나타내는 DataQualityObservation 객체의 목록입니다.

DataQualityAnalyzerResult 구조

데이터 품질 분석기의 평가 결과를 설명합니다.

필드
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 분석기의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 UTF-8 문자열입니다.

    데이터 품질 분석기에 대한 설명입니다.

  • EvaluationMessageURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 UTF-8 문자열입니다.

    평가 메시지입니다.

  • EvaluatedMetrics – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 UTF-8 문자열입니다.

    각 값은 숫자(double)입니다.

    분석기 평가와 관련된 지표의 맵입니다.

DataQualityObservation 구조

규칙과 분석기를 평가한 후 생성된 관찰을 설명합니다.

필드
  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 UTF-8 문자열입니다.

    데이터 품질 관찰에 대한 설명입니다.

  • MetricBasedObservationMetricBasedObservation 객체입니다.

    평가된 데이터 품질 지표를 기반으로 하는 관찰을 나타내는 MetricBasedObservation 유형의 객체입니다.

MetricBasedObservation 구조

평가된 데이터 품질 지표를 기반으로 생성된 지표 기반 관찰을 설명합니다.

필드
  • MetricNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    관찰을 생성하는 데 사용된 데이터 품질 지표의 이름입니다.

  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • MetricValuesDataQualityMetricValues 객체입니다.

    데이터 품질 지표 값의 분석을 나타내는 유형 DataQualityMetricValues의 객체입니다.

  • NewRules – UTF-8 문자열의 배열입니다.

    데이터 품질 지표 값을 기반으로 관찰의 일부로 생성된 새 데이터 품질 규칙의 목록입니다.

DataQualityMetricValues 구조

과거 데이터 분석에 따른 데이터 품질 지표 값을 설명합니다.

필드
  • ActualValue - 숫자(double)입니다.

    데이터 품질 지표의 실제 값입니다.

  • ExpectedValue - 숫자(double)입니다.

    과거 데이터 분석에 따른 데이터 품질 지표의 예상 값입니다.

  • LowerLimit - 숫자(double)입니다.

    과거 데이터 분석에 따른 데이터 품질 지표 값의 하한입니다.

  • UpperLimit - 숫자(double)입니다.

    과거 데이터 분석에 따른 데이터 품질 지표 값의 상한입니다.

DataQualityRuleResult 구조

데이터 품질 규칙 평가 결과를 설명합니다.

필드
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙에 대한 설명입니다.

  • EvaluationMessageURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 UTF-8 문자열입니다.

    평가 메시지입니다.

  • Result – UTF-8 문자열입니다(유효한 값: PASS | FAIL | ERROR).

    규칙의 통과 또는 실패 상태입니다.

  • EvaluatedMetrics – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 UTF-8 문자열입니다.

    각 값은 숫자(double)입니다.

    규칙 평가와 관련된 지표 맵입니다.

  • EvaluatedRuleURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 UTF-8 문자열입니다.

    평가된 규칙입니다.

DataQualityResultDescription 구조

데이터 품질 결과를 설명합니다.

필드
  • ResultIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 데이터 품질 결과의 고유한 결과 ID입니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블 이름입니다.

  • JobNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 이름입니다.

  • JobRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 실행 ID입니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 시작된 시간입니다.

DataQualityResultFilterCriteria 구조

데이터 품질 결과를 반환하는 데 사용되는 기준입니다.

필드
  • DataSourceDataSource 객체입니다.

    지정된 데이터 소스별로 결과를 필터링합니다. 예를 들어 AWS Glue 테이블의 모든 결과를 검색합니다.

  • JobNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    지정된 작업 이름을 기준으로 결과를 필터링합니다.

  • JobRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    지정된 작업 실행 ID를 기준으로 결과를 필터링합니다.

  • StartedAfter – 타임스탬프입니다.

    이 시간 이후에 시작된 실행을 기준으로 결과를 필터링합니다.

  • StartedBefore – 타임스탬프입니다.

    이 시간 이전에 시작된 실행을 기준으로 결과를 필터링합니다.

DataQualityRulesetFilterCriteria 구조

데이터 품질 규칙 세트를 필터링하는 데 사용되는 기준입니다.

필드
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트 필터 기준의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트 필터 기준에 대한 설명입니다.

  • CreatedBefore – 타임스탬프입니다.

    이 날짜 이전에 생성된 규칙 세트에서 필터링합니다.

  • CreatedAfter – 타임스탬프입니다.

    이 날짜 이후에 생성된 규칙 세트에서 필터링합니다.

  • LastModifiedBefore – 타임스탬프입니다.

    이 날짜 이전에 마지막으로 수정된 규칙 세트에서 필터링합니다.

  • LastModifiedAfter – 타임스탬프입니다.

    이 날짜 이후에 마지막으로 수정된 규칙 세트에서 필터링합니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    대상 테이블의 이름 및 데이터베이스 이름입니다.

StatisticAnnotation 구조

통계 주석.

필드
  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    프로필 ID.

  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • StatisticRecordedOn – 타임스탬프입니다.

    주석이 달린 통계가 기록된 시점의 타임스탬프.

  • InclusionAnnotationTimestampedInclusionAnnotation 객체입니다.

    통계에 적용된 포함 주석.

TimestampedInclusionAnnotation 구조

타임스탬프가 지정된 포함 주석.

필드
  • Value – UTF-8 문자열입니다(유효한 값: INCLUDE | EXCLUDE).

    포함 주석 값.

  • LastModifiedOn – 타임스탬프입니다.

    포함 주석이 마지막으로 수정된 시점의 타임스탬프.

AnnotationError 구조

실패한 주석.

필드
  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    실패한 주석의 프로필 ID.

  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    실패한 주석의 통계 ID.

  • FailureReasonURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    주석이 실패한 이유.

DatapointInclusionAnnotation 구조

포함 주석.

필드
  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계가 속한 데이터 품질 프로필의 ID.

  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • InclusionAnnotation – UTF-8 문자열입니다(유효한 값: INCLUDE | EXCLUDE).

    통계에 적용할 포함 주석 값.

StatisticSummaryList 목록

StatisticSummary 목록.

StatisticSummary 객체 어레이.

StatisticSummary 목록.

StatisticSummary 구조

통계에 대한 요약 정보.

필드
  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    프로필 ID.

  • RunIdentifierRunIdentifier 객체입니다.

    실행 식별자

  • StatisticNameCustom string pattern #32과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 이름.

  • DoubleValue - 숫자(double)입니다.

    통계 값.

  • EvaluationLevel – UTF-8 문자열입니다(유효한 값: Dataset="DATASET" | Column="COLUMN" | Multicolumn="MULTICOLUMN").

    통계의 평가 수준. 가능한 값: Dataset, Column, Multicolumn.

  • ColumnsReferenced – UTF-8 문자열의 배열입니다.

    통계에서 참조하는 열 목록.

  • ReferencedDatasets – UTF-8 문자열의 배열입니다.

    통계에서 참조하는 데이터세트 목록.

  • StatisticProperties – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 UTF-8 문자열입니다.

    각 값은 URI address multi-line string pattern와 일치하는 설명 문자열(2,048바이트 이하)입니다.

    NameStringDescriptionString이 포함된 StatisticPropertiesMap

  • RecordedOn – 타임스탬프입니다.

    통계가 기록된 시점의 타임스탬프.

  • InclusionAnnotationTimestampedInclusionAnnotation 객체입니다.

    통계의 포함 주석.

RunIdentifier 구조

실행 식별자.

필드

StatisticModelResult 구조

통계 모델 결과.

필드
  • LowerBound - 숫자(double)입니다.

    하한.

  • UpperBound - 숫자(double)입니다.

    상한.

  • PredictedValue - 숫자(double)입니다.

    예측된 값.

  • ActualValue - 숫자(double)입니다.

    실제 값.

  • Date – 타임스탬프입니다.

    날짜.

  • InclusionAnnotation – UTF-8 문자열입니다(유효한 값: INCLUDE | EXCLUDE).

    포함 주석.

운영

StartDataQualityRulesetEvaluationRun 작업(Python: start_data_quality_ruleset_evaluation_run)

규칙 세트 정의(권장 또는 사용자 고유)가 있는 경우 이 작업을 호출하여 데이터 소스(AWS Glue 테이블)를 기준으로 규칙 세트를 평가합니다. 평가 시 GetDataQualityResult API로 검색할 수 있는 결과가 계산됩니다.

요청
  • DataSource필수(Required): DataSource 객체입니다.

    이 실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

  • Role필수: UTF-8 문자열입니다.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • ClientTokenSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    멱등성에 사용되며 동일한 리소스의 여러 인스턴스를 생성하거나 시작하지 않으려면 임의의 ID(예: UUID)로 설정하는 것이 좋습니다.

  • AdditionalRunOptionsDataQualityEvaluationRunAdditionalRunOptions 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 실행 옵션입니다.

  • RulesetNames필수: 1~10개 문자열의 UTF-8 문자열 배열입니다.

    규칙 세트 이름의 목록입니다.

  • AdditionalDataSources – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 UTF-8 문자열입니다.

    각 값은 DataSource 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 데이터 소스에 대한 참조 문자열의 맵입니다.

응답
  • RunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

Errors
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRulesetEvaluationRun 작업(Python: cancel_data_quality_ruleset_evaluation_run)

데이터 소스에 대해 규칙 세트를 평가 중인 실행을 취소합니다.

요청
  • RunId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRulesetEvaluationRun 작업(Python: get_data_quality_ruleset_evaluation_run)

데이터 소스에 대해 규칙 세트를 평가하는 특정 실행을 검색합니다.

요청
  • RunId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

응답
  • RunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

  • DataSourceDataSource 객체입니다.

    이 평가 실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

  • Role – UTF-8 문자열입니다.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • AdditionalRunOptionsDataQualityEvaluationRunAdditionalRunOptions 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 실행 옵션입니다.

  • Status – UTF-8 문자열입니다(유효한 값: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    이 실행의 상태입니다.

  • ErrorString – UTF-8 문자열입니다.

    실행과 연결된 오류 문자열입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 권장 실행이 수정된 마지막 시점입니다.

  • CompletedOn – 타임스탬프입니다.

    이 실행이 완료된 날짜와 시간입니다.

  • ExecutionTime - 숫자(정수)입니다.

    이 실행이 리소스를 사용한 시간(초)입니다.

  • RulesetNames – UTF-8 문자열의 배열입니다(1~10개 문자열).

    실행에 대한 규칙 세트 이름 목록입니다. 현재 이 파라미터는 하나의 규칙 집합 이름만 사용합니다.

  • ResultIds – UTF-8 문자열의 배열입니다(1~10개 문자열).

    실행의 데이터 품질 결과에 대한 결과 ID 목록입니다.

  • AdditionalDataSources – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 UTF-8 문자열입니다.

    각 값은 DataSource 객체입니다.

    평가 실행에 대해 지정할 수 있는 추가 데이터 소스에 대한 참조 문자열의 맵입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesetEvaluationRuns 작업(Python: list_data_quality_ruleset_evaluation_runs)

규칙 세트가 데이터 소스에 대해 평가되는 필터 조건을 충족하는 모든 실행을 나열합니다.

요청
  • FilterDataQualityRulesetEvaluationRunFilter 객체입니다.

    필터 기준입니다.

  • NextToken – UTF-8 문자열입니다.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

응답
  • RunsDataQualityRulesetEvaluationRunDescription 객체의 배열입니다.

    데이터 품질 규칙 세트 실행을 나타내는 DataQualityRulesetEvaluationRunDescription 객체 목록입니다.

  • NextToken – UTF-8 문자열입니다.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartDataQualityRuleRecommendationRun 작업(Python: start_data_quality_rule_recommendation_run)

어떤 규칙을 작성해야 할지 모를 때 규칙을 생성하는 데 사용되는 권장 실행을 시작합니다. AWS Glue 데이터 품질은 데이터를 분석하고 잠재적 규칙 세트에 대한 권장 사항을 제시합니다. 그런 다음 규칙 세트를 분류하고 생성된 규칙 세트를 원하는 대로 수정할 수 있습니다.

권장 사항 실행은 90일 후에 자동으로 삭제됩니다.

요청

데이터 품질 규칙 권장 사항 요청.

  • DataSource필수(Required): DataSource 객체입니다.

    이 실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

  • Role필수: UTF-8 문자열입니다.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • CreatedRulesetNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트의 이름입니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientTokenSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    멱등성에 사용되며 동일한 리소스의 여러 인스턴스를 생성하거나 시작하지 않으려면 임의의 ID(예: UUID)로 설정하는 것이 좋습니다.

응답
  • RunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRuleRecommendationRun 작업(Python: cancel_data_quality_rule_recommendation_run)

규칙을 생성하는 데 사용된 지정된 권장 실행을 취소합니다.

요청
  • RunId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleRecommendationRun 작업(Python: get_data_quality_rule_recommendation_run)

규칙을 생성하는 데 사용된 지정된 권장 실행을 가져옵니다.

요청
  • RunId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

응답

데이터 품질 규칙 권장 사항 실행에 대한 응답.

  • RunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

  • DataSourceDataSource 객체입니다.

    이 실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

  • Role – UTF-8 문자열입니다.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • Status – UTF-8 문자열입니다(유효한 값: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    이 실행의 상태입니다.

  • ErrorString – UTF-8 문자열입니다.

    실행과 연결된 오류 문자열입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 권장 실행이 수정된 마지막 시점입니다.

  • CompletedOn – 타임스탬프입니다.

    이 실행이 완료된 날짜와 시간입니다.

  • ExecutionTime - 숫자(정수)입니다.

    이 실행이 리소스를 사용한 시간(초)입니다.

  • RecommendedRuleset – UTF-8 문자열입니다(1~65536바이트 이하)

    시작 규칙 권장 실행이 완료되면 권장 규칙 세트(규칙 세트)가 생성됩니다. 이 멤버는 DQDL(데이터 품질 정의 언어) 형식 규칙을 포함합니다.

  • CreatedRulesetNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    실행에서 생성된 규칙 세트의 이름입니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRuleRecommendationRuns 작업(Python: list_data_quality_rule_recommendation_runs)

필터 기준에 맞는 권장 실행을 나열합니다.

요청
  • FilterDataQualityRuleRecommendationRunFilter 객체입니다.

    필터 기준입니다.

  • NextToken – UTF-8 문자열입니다.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

응답
  • RunsDataQualityRuleRecommendationRunDescription 객체의 배열입니다.

    DataQualityRuleRecommendationRunDescription 객체의 목록.

  • NextToken – UTF-8 문자열입니다.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityResult 작업(Python: get_data_quality_result)

데이터 품질 규칙 평가 결과를 검색합니다.

요청
  • ResultId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과의 고유한 결과 ID입니다.

응답

데이터 품질 결과에 대한 응답.

  • ResultIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과의 고유한 결과 ID입니다.

  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과의 프로필 ID입니다.

  • Score – 1.0 이하의 숫자(실수)입니다.

    집계된 데이터 품질 점수입니다. 총 규칙 수에 전달된 규칙의 비율을 나타냅니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블입니다(있는 경우).

  • RulesetNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 규칙 세트의 이름입니다.

  • EvaluationContext – UTF-8 문자열입니다.

    AWS Glue Studio의 작업 컨텍스트에서 캔버스의 각 노드에는 일반적으로 일종의 이름이 할당되며 데이터 품질 노드에는 이름이 지정됩니다. 여러 노드의 경우 evaluationContext에서 노드를 구분할 수 있습니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 시작된 날짜와 시간입니다.

  • CompletedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 완료된 날짜와 시간입니다.

  • JobNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 이름입니다(있는 경우).

  • JobRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 실행 ID입니다(있는 경우).

  • RulesetEvaluationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트 평가와 연결된 고유한 실행 ID입니다.

  • RuleResultsDataQualityRuleResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 규칙의 결과를 나타내는 DataQualityRuleResult 객체 목록입니다.

  • AnalyzerResultsDataQualityAnalyzerResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 분석기의 결과를 나타내는 DataQualityAnalyzerResult 객체의 목록입니다.

  • ObservationsDataQualityObservation 객체의 배열이며 구조는 50개 이하입니다.

    규칙과 분석기를 평가한 후 생성된 관찰을 나타내는 DataQualityObservation 객체의 목록입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • EntityNotFoundException

BatchGetDataQualityResult 작업(Python: batch_get_data_quality_result)

지정된 결과 ID에 대한 데이터 품질 결과 목록을 검색합니다.

요청
  • ResultIds필수: 1~100개 문자열의 UTF-8 문자열 배열입니다.

    데이터 품질 결과에 대한 고유한 결과 ID 목록입니다.

응답
  • Results필수(Required): DataQualityResult 객체의 배열입니다.

    데이터 품질 결과를 나타내는 DataQualityResult 객체 목록입니다.

  • ResultsNotFound – UTF-8 문자열의 배열입니다(1~100개 문자열).

    결과를 찾을 수 없는 결과 ID 목록입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityResults 작업(Python: list_data_quality_results)

계정의 모든 데이터 품질 실행 결과를 반환합니다.

요청
  • FilterDataQualityResultFilterCriteria 객체입니다.

    필터 기준입니다.

  • NextToken – UTF-8 문자열입니다.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

응답
  • Results필수(Required): DataQualityResultDescription 객체의 배열입니다.

    DataQualityResultDescription 객체의 목록.

  • NextToken – UTF-8 문자열입니다.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

CreateDataQualityRuleset 작업(Python: create_data_quality_ruleset)

지정된 AWS Glue 테이블에 적용된 DQDL 규칙을 사용하여 데이터 품질 규칙 세트를 생성합니다.

DQDL(데이터 품질 정의 언어)을 사용하여 규칙 세트를 생성합니다. 자세한 내용은 AWS Glue 개발자 안내서를 참조하세요.

요청

데이터 품질 규칙 세트를 생성하려는 요청.

  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트의 고유한 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    데이터 품질 규칙 세트에 대한 설명입니다.

  • Ruleset필수: 2~65536바이트 길이의 UTF-8 문자열입니다.

    DQDL(데이터 품질 정의 언어) 규칙 세트입니다. 자세한 내용은 AWS Glue 개발자 안내서를 참조하세요.

  • Tags – 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.

    각 키는 길이가 1~128바이트인 UTF-8 문자열입니다.

    각 값은 256 바이트 이하 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트에 적용된 태그 목록입니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    데이터 품질 규칙 세트와 연결된 대상 테이블입니다.

  • RecommendationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    권장 실행의 고유한 실행 ID입니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientTokenSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    멱등성에 사용되며 동일한 리소스의 여러 인스턴스를 생성하거나 시작하지 않으려면 임의의 ID(예: UUID)로 설정하는 것이 좋습니다.

응답
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트의 고유한 이름입니다.

Errors
  • InvalidInputException

  • AlreadyExistsException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

DeleteDataQualityRuleset 작업(Python: delete_data_quality_ruleset)

데이터 품질 규칙 세트를 삭제합니다.

요청
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트의 이름입니다.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleset 작업(Python: get_data_quality_ruleset)

식별자 또는 이름을 기준으로 기존 규칙 세트를 반환합니다.

요청
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트의 이름입니다.

응답

데이터 품질 규칙 세트 응답을 반환합니다.

  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset – UTF-8 문자열입니다(1~65536바이트 이하)

    DQDL(데이터 품질 정의 언어) 규칙 세트입니다. 자세한 내용은 AWS Glue 개발자 안내서를 참조하세요.

  • TargetTableDataQualityTargetTable 객체입니다.

    대상 테이블의 이름 및 데이터베이스 이름입니다.

  • CreatedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 생성된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 수정된 마지막 시점입니다.

  • RecommendationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    권장 실행에서 규칙 세트가 생성되면 이 실행 ID가 생성되어 두 규칙을 서로 연결합니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesets 작업(Python: list_data_quality_rulesets)

지정된 AWS Glue 테이블 목록에 대한 페이지 매김 규칙 세트 목록을 반환합니다.

요청
  • NextToken – UTF-8 문자열입니다.

    결과를 오프셋하기 위한 페이지 매김 토큰입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    반환할 최대 결과 수입니다.

  • FilterDataQualityRulesetFilterCriteria 객체입니다.

    필터 기준입니다.

  • Tags – 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.

    각 키는 길이가 1~128바이트인 UTF-8 문자열입니다.

    각 값은 256 바이트 이하 길이의 UTF-8 문자열입니다.

    키-값 페어 태그의 목록입니다.

응답
  • RulesetsDataQualityRulesetListDetails 객체의 배열입니다.

    지정된 AWS Glue 테이블 목록에 대한 페이지 매김 규칙 세트 목록입니다.

  • NextToken – UTF-8 문자열입니다.

    추가 결과를 사용할 수 있는 경우 페이지 매김 토큰입니다.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

UpdateDataQualityRuleset 작업(Python: update_data_quality_ruleset)

지정된 데이터 품질 규칙 세트를 업데이트합니다.

요청
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset – UTF-8 문자열입니다(1~65536바이트 이하)

    DQDL(데이터 품질 정의 언어) 규칙 세트입니다. 자세한 내용은 AWS Glue 개발자 안내서를 참조하세요.

응답
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset – UTF-8 문자열입니다(1~65536바이트 이하)

    DQDL(데이터 품질 정의 언어) 규칙 세트입니다. 자세한 내용은 AWS Glue 개발자 안내서를 참조하세요.

Errors
  • EntityNotFoundException

  • AlreadyExistsException

  • IdempotentParameterMismatchException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

ListDataQualityStatistics 작업(Python: list_data_quality_statistics)

데이터 품질 통계 목록을 검색합니다.

요청
  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    프로필 ID.

  • TimestampFilterTimestampFilter 객체입니다.

    타임스탬프 필터.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    이 요청에서 반환할 최대 결과 수입니다.

  • NextToken – UTF-8 문자열입니다.

    결과의 다음 페이지를 요청하기 위한 페이지 매김 토큰.

응답
  • StatisticsStatisticSummary 객체의 배열입니다.

    StatisticSummaryList.

  • NextToken – UTF-8 문자열입니다.

    결과의 다음 페이지를 요청하기 위한 페이지 매김 토큰.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

TimestampFilter 구조

타임스탬프 필터.

필드
  • RecordedBefore – 타임스탬프입니다.

    특정 시간 이전의 통계를 결과에 포함해야 하는 경우 해당 타임스탬프.

  • RecordedAfter – 타임스탬프입니다.

    특정 시간 이후의 통계를 결과에 포함해야 하는 경우 해당 타임스탬프.

CreateDataQualityRulesetRequest 구조

데이터 품질 규칙 세트를 생성하려는 요청.

필드
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트의 고유한 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    데이터 품질 규칙 세트에 대한 설명입니다.

  • Ruleset필수: 2~65536바이트 길이의 UTF-8 문자열입니다.

    DQDL(데이터 품질 정의 언어) 규칙 세트입니다. 자세한 내용은 AWS Glue 개발자 안내서를 참조하세요.

  • Tags – 50개 이하의 페어로 구성된 키-값 페어의 맵 배열입니다.

    각 키는 길이가 1~128바이트인 UTF-8 문자열입니다.

    각 값은 256 바이트 이하 길이의 UTF-8 문자열입니다.

    데이터 품질 규칙 세트에 적용된 태그 목록입니다.

  • TargetTableDataQualityTargetTable 객체입니다.

    데이터 품질 규칙 세트와 연결된 대상 테이블입니다.

  • RecommendationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    권장 실행의 고유한 실행 ID입니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientTokenSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    멱등성에 사용되며 동일한 리소스의 여러 인스턴스를 생성하거나 시작하지 않으려면 임의의 ID(예: UUID)로 설정하는 것이 좋습니다.

GetDataQualityRulesetResponse 구조

데이터 품질 규칙 세트 응답을 반환합니다.

필드
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트의 이름입니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    규칙 세트에 대한 설명입니다.

  • Ruleset – UTF-8 문자열입니다(1~65536바이트 이하)

    DQDL(데이터 품질 정의 언어) 규칙 세트입니다. 자세한 내용은 AWS Glue 개발자 안내서를 참조하세요.

  • TargetTableDataQualityTargetTable 객체입니다.

    대상 테이블의 이름 및 데이터베이스 이름입니다.

  • CreatedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 생성된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 세트가 수정된 마지막 시점입니다.

  • RecommendationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    권장 실행에서 규칙 세트가 생성되면 이 실행 ID가 생성되어 두 규칙을 서로 연결합니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

GetDataQualityResultResponse 구조

데이터 품질 결과에 대한 응답.

필드
  • ResultIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과의 고유한 결과 ID입니다.

  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과의 프로필 ID입니다.

  • Score – 1.0 이하의 숫자(실수)입니다.

    집계된 데이터 품질 점수입니다. 총 규칙 수에 전달된 규칙의 비율을 나타냅니다.

  • DataSourceDataSource 객체입니다.

    데이터 품질 결과와 연결된 테이블입니다(있는 경우).

  • RulesetNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 규칙 세트의 이름입니다.

  • EvaluationContext – UTF-8 문자열입니다.

    AWS Glue Studio의 작업 컨텍스트에서 캔버스의 각 노드에는 일반적으로 일종의 이름이 할당되며 데이터 품질 노드에는 이름이 지정됩니다. 여러 노드의 경우 evaluationContext에서 노드를 구분할 수 있습니다.

  • StartedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 시작된 날짜와 시간입니다.

  • CompletedOn – 타임스탬프입니다.

    이 데이터 품질 결과에 대한 실행이 완료된 날짜와 시간입니다.

  • JobNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 이름입니다(있는 경우).

  • JobRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 결과와 연결된 작업 실행 ID입니다(있는 경우).

  • RulesetEvaluationRunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트 평가와 연결된 고유한 실행 ID입니다.

  • RuleResultsDataQualityRuleResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 규칙의 결과를 나타내는 DataQualityRuleResult 객체 목록입니다.

  • AnalyzerResultsDataQualityAnalyzerResult 객체의 배열이며 구조는 2,000개 이하입니다.

    각 분석기의 결과를 나타내는 DataQualityAnalyzerResult 객체의 목록입니다.

  • ObservationsDataQualityObservation 객체의 배열이며 구조는 50개 이하입니다.

    규칙과 분석기를 평가한 후 생성된 관찰을 나타내는 DataQualityObservation 객체의 목록입니다.

StartDataQualityRuleRecommendationRunRequest 구조

데이터 품질 규칙 권장 사항 요청.

필드
  • DataSource필수: DataSource 객체입니다.

    이 실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

  • Role필수: UTF-8 문자열입니다.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • CreatedRulesetNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    규칙 세트의 이름입니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

  • ClientTokenSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    멱등성에 사용되며 동일한 리소스의 여러 인스턴스를 생성하거나 시작하지 않으려면 임의의 ID(예: UUID)로 설정하는 것이 좋습니다.

GetDataQualityRuleRecommendationRunResponse 구조

데이터 품질 규칙 권장 사항 실행에 대한 응답.

필드
  • RunIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 실행과 연결된 고유의 실행 식별자입니다.

  • DataSourceDataSource 객체입니다.

    이 실행과 연결된 데이터 소스(AWS Glue 테이블)입니다.

  • Role – UTF-8 문자열입니다.

    실행 결과를 암호화하기 위해 제공되는 IAM 역할입니다.

  • NumberOfWorkers - 숫자(정수)입니다.

    실행에 사용할 G.1X 작업자 수입니다. 기본값은 5입니다.

  • Timeout – 1 이상의 숫자(정수)입니다.

    실행 제한 시간(분)입니다. 실행에서 리소스를 소비하여 중지되기 전에 TIMEOUT 상태로 들어가는 최대 시간입니다. 기본값은 2,880 분(48 시간)입니다.

  • Status – UTF-8 문자열입니다(유효한 값: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    이 실행의 상태입니다.

  • ErrorString – UTF-8 문자열입니다.

    실행과 연결된 오류 문자열입니다.

  • StartedOn – 타임스탬프입니다.

    이 실행이 시작된 날짜와 시간입니다.

  • LastModifiedOn – 타임스탬프입니다.

    타임스탬프입니다. 이 데이터 품질 규칙 권장 실행이 수정된 마지막 시점입니다.

  • CompletedOn – 타임스탬프입니다.

    이 실행이 완료된 날짜와 시간입니다.

  • ExecutionTime - 숫자(정수)입니다.

    이 실행이 리소스를 사용한 시간(초)입니다.

  • RecommendedRuleset – UTF-8 문자열입니다(1~65536바이트 이하)

    시작 규칙 권장 실행이 완료되면 권장 규칙 세트(규칙 세트)가 생성됩니다. 이 멤버는 DQDL(데이터 품질 정의 언어) 형식 규칙을 포함합니다.

  • CreatedRulesetNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    실행에서 생성된 규칙 세트의 이름입니다.

  • DataQualitySecurityConfigurationSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    데이터 품질 암호화 옵션을 사용하여 생성된 보안 구성의 이름입니다.

BatchPutDataQualityStatisticAnnotation 작업(Python: batch_put_data_quality_statistic_annotation)

특정 데이터 품질 통계에 대해 시간 경과에 따른 데이터 포인트에 주석을 지정합니다.

요청
  • InclusionAnnotations필수(Required): DatapointInclusionAnnotation 객체의 배열입니다.

    DatapointInclusionAnnotation의 목록.

  • ClientTokenSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    클라이언트 토큰.

응답
  • FailedInclusionAnnotationsAnnotationError 객체의 배열입니다.

    AnnotationError의 목록.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • ResourceNumberLimitExceededException

GetDataQualityModel 작업(Python: get_data_quality_model)

자세한 정보(CompletedOn, StartedOn, FailureReason)와 함께 모델의 훈련 상태를 검색합니다.

요청
  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • ProfileId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    프로필 ID.

응답
  • Status – UTF-8 문자열입니다(유효한 값: RUNNING | SUCCEEDED | FAILED).

    데이터 품질 모델의 훈련 상태.

  • StartedOn – 타임스탬프입니다.

    데이터 품질 모델 훈련이 시작된 시점의 타임스탬프.

  • CompletedOn – 타임스탬프입니다.

    데이터 품질 모델 훈련이 완료된 시점의 타임스탬프.

  • FailureReasonSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    훈련 실패 이유.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityModelResult 작업(Python: get_data_quality_model_result)

지정된 프로필 ID에 대한 통계의 예측을 검색합니다.

요청
  • StatisticId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • ProfileId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    프로필 ID.

응답
  • CompletedOn – 타임스탬프입니다.

    데이터 품질 모델 훈련이 완료된 시점의 타임스탬프.

  • ModelStatisticModelResult 객체의 배열입니다.

    StatisticModelResult 목록

Errors
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityStatisticAnnotations 작업(Python: list_data_quality_statistic_annotations)

데이터 품질 통계에 대한 주석을 검색합니다.

요청
  • StatisticIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계 ID입니다.

  • ProfileIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    프로필 ID.

  • TimestampFilterTimestampFilter 객체입니다.

    타임스탬프 필터.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    이 요청에서 반환할 최대 결과 수입니다.

  • NextToken – UTF-8 문자열입니다.

    다음 결과 세트를 검색하기 위한 페이지 매김 토큰.

응답
  • AnnotationsStatisticAnnotation 객체의 배열입니다.

    통계에 적용된 StatisticAnnotation의 목록

  • NextToken – UTF-8 문자열입니다.

    다음 결과 세트를 검색하기 위한 페이지 매김 토큰.

Errors
  • InvalidInputException

  • InternalServiceException

PutDataQualityProfileAnnotation 작업(Python: put_data_quality_profile_annotation)

프로필의 모든 데이터 포인트에 주석을 작성합니다.

요청
  • ProfileId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    주석을 달 데이터 품질 모니터링 프로필의 ID.

  • InclusionAnnotation필수: UTF-8 문자열입니다(유효한 값: INCLUDE | EXCLUDE).

    프로필에 적용할 포함 주석 값.

응답
  • 무응답 파라미터.

Errors
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException