ColumnValues - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

ColumnValues

Führt einen Ausdruck für die Werte in einer Spalte aus.

Syntax

ColumnValues <COL_NAME> <EXPRESSION>
  • COL_NAME – Der Name der Spalte, anhand der Sie die Datenqualitätsregel auswerten möchten.

    Unterstützte Spaltentypen: Jeder Spaltentyp

  • AUSDRUCK – Ein Ausdruck, der für die Antwort des Regeltyps ausgeführt wird, um einen booleschen Wert zu erzeugen. Weitere Informationen finden Sie unter Ausdrücke.

Beispiel: Zulässige Werte

Die folgende Beispielregel prüft, ob sich jeder Wert in der angegebenen Spalte in einer Gruppe zulässiger Werte befindet (einschließlich Null, leer und Zeichenfolgen mit nur Leerzeichen).

ColumnValues "Country" in [ "US", "CA", "UK", NULL, EMPTY, WHITESPACES_ONLY ] ColumnValues "gender" in ["F", "M"] where "weightinkgs < 10"

Beispiel: Regulärer Ausdruck

Die folgende Beispielregel prüft die Werte in einer Spalte anhand eines regulären Ausdrucks.

ColumnValues "First_Name" matches "[a-zA-Z]*"

Beispiel: Datumswerte

Die folgende Beispielregel prüft die Werte in einer Datumsspalte anhand eines Datumsausdrucks.

ColumnValues "Load_Date" > (now() - 3 days)

Beispiel: Numerische Werte

Die folgende Beispielregel prüft, ob die Spaltenwerte mit einer bestimmten numerischen Einschränkung übereinstimmen.

ColumnValues "Customer_ID" between 1 and 2000

Null-Verhalten

Für alle ColumnValues Regeln (außer != undNOT IN) gilt, dass NULL Zeilen die Regel nicht erfüllen. Wenn die Regel aufgrund eines Nullwerts fehlschlägt, wird die Fehlerursache wie folgt angezeigt:

Value: NULL does not meet the constraint requirement!

Die folgende zusammengesetzte Beispielregel bietet eine Möglichkeit, NULL Werte explizit zuzulassen:

(ColumnValues "Age" > 21) OR (ColumnValues "Age" = NULL)

Negierte ColumnValues Regeln, die die not in Syntax != und verwenden, gelten für NULL Zeilen. Zum Beispiel:

ColumnValues "Age" != 21
ColumnValues "Age" not in [21, 22, 23]

Die folgenden Beispiele bieten eine Möglichkeit, Werte explizit als falsch einzuschätzen NULL

(ColumnValues "Age" != 21) AND (ColumnValues "Age" != NULL)
ColumnValues "Age" not in [21, 22, 23, NULL]