ColumnValues - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

ColumnValues

Führt einen Ausdruck für die Werte in einer Spalte aus.

Syntax

ColumnValues <COL_NAME> <EXPRESSION>
  • COL_ NAME — Der Name der Spalte, anhand derer Sie die Datenqualitätsregel auswerten möchten.

    Unterstützte Spaltentypen: Jeder Spaltentyp

  • EXPRESSION— Ein Ausdruck, der anhand der Regelantwort ausgeführt werden soll, um einen booleschen Wert zu erzeugen. Weitere Informationen finden Sie unter Ausdrücke.

Beispiel: Zulässige Werte

Die folgende Beispielregel prüft, ob jeder Wert in der angegebenen Spalte zu einer Gruppe zulässiger Werte gehört (einschließlich Null, Leerzeichen und Zeichenfolgen mit nur Leerzeichen).

ColumnValues "Country" in [ "US", "CA", "UK", NULL, EMPTY, WHITESPACES_ONLY ] ColumnValues "gender" in ["F", "M"] where "weightinkgs < 10"

Beispiel: Regulärer Ausdruck

Die folgende Beispielregel prüft die Werte in einer Spalte anhand eines regulären Ausdrucks.

ColumnValues "First_Name" matches "[a-zA-Z]*"

Beispiel: Datumswerte

Die folgende Beispielregel prüft die Werte in einer Datumsspalte anhand eines Datumsausdrucks.

ColumnValues "Load_Date" > (now() - 3 days)

Beispiel: Numerische Werte

Die folgende Beispielregel prüft, ob die Spaltenwerte mit einer bestimmten numerischen Einschränkung übereinstimmen.

ColumnValues "Customer_ID" between 1 and 2000

Null-Verhalten

Für alle ColumnValues Regeln (außer != undNOT IN) gilt, dass NULL Zeilen die Regel nicht erfüllen. Wenn die Regel aufgrund eines Nullwerts fehlschlägt, wird die Fehlerursache wie folgt angezeigt:

Value: NULL does not meet the constraint requirement!

Die folgende zusammengesetzte Beispielregel bietet eine Möglichkeit, NULL Werte explizit zuzulassen:

(ColumnValues "Age" > 21) OR (ColumnValues "Age" = NULL)

Negierte ColumnValues Regeln, die die not in Syntax != und verwenden, gelten für NULL Zeilen. Beispielsweise:

ColumnValues "Age" != 21
ColumnValues "Age" not in [21, 22, 23]

Die folgenden Beispiele bieten eine Möglichkeit, Werte explizit als falsch einzustufen NULL

(ColumnValues "Age" != 21) AND (ColumnValues "Age" != NULL)
ColumnValues "Age" not in [21, 22, 23, NULL]