ColumnDataType - AWS Glue

ColumnDataType

제공된 예상 유형과 비교하여 지정된 열에 있는 값의 고유한 데이터 형식을 확인합니다. with threshold 식을 수락하여 열에 있는 값의 하위 세트를 확인합니다.

구문

ColumnDataType <COL_NAME> = <EXPECTED_TYPE>
  • COL_NAME – 데이터 품질 규칙을 평가하려는 열의 이름입니다.

    지원되는 열 유형: 문자열 유형

    지원되는 열 유형: Byte, Decimal, Double, Float, Integer, Long, Short

  • EXPECTED_TYPE - 열의 예상 값 유형입니다.

    지원되는 값: Boolean, Date, Timestamp, Integer, Double, Float, Long

    지원되는 열 유형: Byte, Decimal, Double, Float, Integer, Long, Short

  • EXPRESSION - 예상 유형의 값 비율을 지정하는 선택적 표현식입니다.

    지원되는 열 유형: Byte, Decimal, Double, Float, Integer, Long, Short

예: 열 데이터 형식 정수 역할의 문자열

다음 예제 규칙은 문자열 유형인 지정된 열의 값이 실제로 정수인지 여부를 확인합니다.

ColumnDataType "colA" = "INTEGER"

예: 열 데이터 형식 정수 역할의 문자열에서 값의 하위 세트 확인

다음 예제 규칙은 문자열 유형인 지정된 열의 값 중 90%가 실제로 정수인지 여부를 확인합니다.

ColumnDataType "colA" = "INTEGER" with threshold > 0.9