ColumnDataType - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

ColumnDataType

Vérifie le type de données inhérent aux valeurs d'une colonne donnée par rapport au type attendu fourni. Accepte une expression with threshold pour vérifier la présence d'un sous-ensemble des valeurs de la colonne.

Syntaxe

ColumnDataType <COL_NAME> = <EXPECTED_TYPE>
  • COL_NAME – Nom de la colonne par rapport à laquelle la règle de qualité des données doit être évaluée.

    Types de colonnes pris en charge : type de chaîne

    Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court

  • EXPECTED_TYPE : le type attendu des valeurs de la colonne.

    Valeurs prises en charge : booléen, date, horodatage, entier, double, flottant, long

    Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court

  • EXPRESSION : une expression facultative pour spécifier le pourcentage de valeurs qui doivent être du type attendu.

    Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court

Exemple : les entiers de type colonne en tant que chaînes

L'exemple de règle suivant vérifie si les valeurs de la colonne donnée, qui est de type chaîne, sont réellement des entiers.

ColumnDataType "colA" = "INTEGER"

Exemple : les entiers de type colonne en tant que chaînes de caractères vérifient un sous-ensemble de valeurs.

L'exemple de règle suivant vérifie si plus de 90 % des valeurs de la colonne donnée, qui est de type chaîne, sont réellement des entiers.

ColumnDataType "colA" = "INTEGER" with threshold > 0.9