Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
DQDLReferenz zum Regeltyp
Dieser Abschnitt enthält eine Referenz für jeden Regeltyp, den AWS Glue Data Quality unterstützt.
Anmerkung
DQDLunterstützt derzeit keine verschachtelten oder listentypischen Spaltendaten.
Die Werte in Klammern in der folgenden Tabelle werden durch die in den Regelargumenten angegebenen Informationen ersetzt.
Regeln erfordern in der Regel ein zusätzliches Argument für den Ausdruck.
Regeltyp | Beschreibung | Argumente | Gemeldete Metriken | Als Regel unterstützt? | Als Analysator unterstützt? | Gibt Ergebnisse auf Zeilenebene zurück? | Unterstützung dynamischer Regeln? | Generiert Beobachtungen | Unterstützt die Syntax der Where-Klausel? |
---|---|---|---|---|---|---|---|---|---|
AggregateMatch | Überprüft, ob zwei Datensätze übereinstimmen, indem zusammenfassende Metriken wie der Gesamtumsatz verglichen werden. Nützlich für Finanzunternehmen, um zu vergleichen, ob alle Daten aus Quellsystemen übernommen werden. | Eine oder mehrere Aggregationen |
Wenn die Namen der ersten und zweiten Aggregationsspalte übereinstimmen:
Wenn die Namen der ersten und zweiten Aggregationsspalte nicht übereinstimmen:
|
Ja | Nein | Nein | Nein | Nein | Nein |
AllStatistics | Eigenständiger Analysator zum Sammeln mehrerer Metriken für die angegebene Spalte in einem Datensatz. | Ein einziger Spaltenname |
Für Spalten jedes Typs:
Zusätzliche Metriken für Spalten mit Zeichenfolgewerten:
Zusätzliche Metriken für Spalten mit numerischen Werten:
|
Nein | Ja | Nein | Nein | Nein | Nein |
ColumnCorrelation | Prüft, wie gut zwei Spalten korreliert sind. | Genau zwei Spaltennamen | Multicolumn.[Column1,Column2].ColumnCorrelation |
Ja | Ja | Nein | Ja | Nein | Ja |
ColumnCount | Prüft, ob Spalten gelöscht wurden. | None | Dataset.*.ColumnCount |
Ja | Ja | Nein | Ja | Ja | Nein |
ColumnDataType | Prüft, ob eine Spalte einem Datentyp entspricht. | Genau ein Spaltenname | Column.[Column].ColumnDataType.Compliance |
Ja | Nein | Nein | Ja, im Schwellenwertausdruck auf Zeilenebene | Nein | Ja |
ColumnExists | Prüft, ob Spalten in einem Datensatz vorhanden sind. Dadurch können Kunden Self-Service-Datenplattformen erstellen, um sicherzustellen, dass bestimmte Spalten verfügbar sind. | Genau ein Spaltenname | N/A | Ja | Nein | Nein | Nein | Nein | Nein |
ColumnLength | Prüft, ob die Datenlänge konsistent ist. | Genau ein Spaltenname |
Zusätzliche Metrik, wenn ein Schwellenwert auf Zeilenebene angegeben ist:
|
Ja | Ja | Ja, wenn ein Schwellenwert auf Zeilenebene angegeben ist | Nein | Ja. Generiert Beobachtungen nur durch die Analyse der Mindest- und Maximallänge | Ja |
ColumnNamesMatchPattern | Prüft, ob die Spaltennamen mit den definierten Mustern übereinstimmen. Nützlich für Governance-Teams, um die Konsistenz der Spaltennamen durchzusetzen. | Ein regulärer Ausdruck für Spaltennamen | Dataset.*.ColumnNamesPatternMatchRatio |
Ja | Nein | Nein | Nein | Nein | Nein |
ColumnValues | Prüft, ob die Daten gemäß den definierten Werten konsistent sind. Diese Regel unterstützt reguläre Ausdrücke. | Genau ein Spaltenname |
Zusätzliche Metrik, wenn ein Schwellenwert auf Zeilenebene angegeben ist:
|
Ja | Ja | Ja, wenn ein Schwellenwert auf Zeilenebene angegeben ist | Nein | Ja. Generiert Beobachtungen nur durch die Analyse der Mindest- und Maximalwerte | Ja |
Vollständigkeit | Prüft, ob Daten leer sind oder NULLs sich darin befinden. | Genau ein Spaltenname |
|
Ja | Ja | Ja | Ja | Ja | Ja |
CustomSql | Kunden können fast jede Art von Datenqualitätsprüfungen durchführenSQL. |
Eine SQL Aussage (Optional) Ein Schwellenwert auf Zeilenebene |
Zusätzliche Metrik, wenn ein Schwellenwert auf Zeilenebene angegeben ist:
|
Ja | Nein | Ja, wenn ein Schwellenwert auf Zeilenebene angegeben ist | Ja | Nein | Nein |
DataFreshness | Prüft, ob die Daten aktuell sind. | Genau ein Spaltenname | Column.[Column].DataFreshness.Compliance |
Ja | Nein | Ja | Nein | Nein | Ja |
DatasetMatch | Vergleicht zwei Datensätze und stellt fest, ob sie synchron sind. |
Name eines Referenzdatensatzes Eine Spaltenzuweisung (Optional) Nach Übereinstimmungen zu durchsuchende Spalten |
Dataset.[ReferenceDatasetAlias].DatasetMatch |
Ja | Nein | Ja | Ja | Nein | Nein |
DistinctValuesCount | Prüft auf doppelte Werte. | Genau ein Spaltenname | Column.[Column].DistinctValuesCount |
Ja | Ja | Ja | Ja | Ja | Ja |
DetectAnomalies | Überprüft die gemeldeten Metriken eines anderen Regeltyps auf Anomalien. | Ein Regeltyp | Metrik(en), die vom Regeltypargument gemeldet wurden | Ja | Nein | Nein | Nein | Nein | Nein |
Entropie | Prüft die Daten auf Entropie. | Genau ein Spaltenname | Column.[Column].Entropy |
Ja | Ja | Nein | Ja | Nein | Ja |
IsComplete | Prüft, ob 100 % der Daten vollständig sind. | Genau ein Spaltenname | Column.[Column].Completeness |
Ja | Nein | Ja | Nein | Nein | Ja |
IsPrimaryKey | Prüft, ob es sich bei einer Spalte um einen Primärschlüssel handelt (nicht NULL und eindeutig). | Genau ein Spaltenname |
Für einzelne Spalte:
Für mehrere Spalten:
|
Ja | Nein | Ja | Nein | Nein | Ja |
IsUnique | Prüft, ob 100 % der Daten eindeutig sind. | Genau ein Spaltenname | Column.[Column].Uniqueness |
Ja | Nein | Ja | Nein | Nein | Ja |
Mean | Prüft, ob der Mittelwert dem eingestellten Schwellenwert entspricht. | Genau ein Spaltenname | Column.[Column].Mean |
Ja | Ja | Ja | Ja | Nein | Ja |
ReferentialIntegrity | Prüft, ob zwei Datensätze referenzielle Integrität aufweisen. |
Ein oder mehrere Spaltennamen aus dem Datensatz Ein oder mehrere Spaltennamen aus dem Referenzdatensatz |
Column.[ReferenceDatasetAlias].ReferentialIntegrity |
Ja | Nein | Ja | Ja | Nein | Nein |
RowCount | Prüft, ob die Anzahl der Datensätze einem Schwellenwert entspricht. | None | Dataset.*.RowCount |
Ja | Ja | Nein | Ja | Ja | Ja |
RowCountMatch | Prüft, ob die Datensatzanzahl zwischen zwei Datensätzen übereinstimmt. | Alias des Referenzdatensatzes | Dataset.[ReferenceDatasetAlias].RowCountMatch |
Ja | Nein | Nein | Ja | Nein | Nein |
StandardDeviation | Prüft, ob die Standardabweichung dem Schwellenwert entspricht. | Genau ein Spaltenname | Column.[Column].StandardDeviation |
Ja | Ja | Ja | Ja | Nein | Ja |
SchemaMatch | Prüft, ob das Schema zwischen zwei Datensätzen übereinstimmt. | Alias des Referenzdatensatzes | Dataset.[ReferenceDatasetAlias].SchemaMatch |
Ja | Nein | Nein | Ja | Nein | Nein |
Summe | Prüft, ob die Summe einem festgelegten Schwellenwert entspricht. | Genau ein Spaltenname | Column.[Column].Sum |
Ja | Ja | Nein | Ja | Nein | Ja |
Eindeutigkeit | Prüft, ob die Eindeutigkeit des Datensatzes dem Schwellenwert entspricht. | Genau ein Spaltenname | Column.[Column].Uniqueness |
Ja | Ja | Ja | Ja | Nein | Ja |
UniqueValueRatio | Prüft, ob das Verhältnis des Einzelwerts dem Schwellenwert entspricht. | Genau ein Spaltenname | Column.[Column].UniqueValueRatio |
Ja | Ja | Ja | Ja | Nein | Ja |
Themen
- AggregateMatch
- ColumnCorrelation
- ColumnCount
- ColumnDataType
- ColumnExists
- ColumnLength
- ColumnNamesMatchPattern
- ColumnValues
- Vollständigkeit
- Benutzerdefiniert SQL
- DataFreshness
- DatasetMatch
- DistinctValuesCount
- Entropie
- IsComplete
- IsPrimaryKey
- IsUnique
- Mean
- ReferentialIntegrity
- RowCount
- RowCountMatch
- StandardDeviation
- Summe
- SchemaMatch
- Eindeutigkeit
- UniqueValueRatio
- DetectAnomalies