UniqueValueRatio - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

UniqueValueRatio

Verifica il rapporto di valori univoci in una colonna rispetto a una determinata espressione. Un rapporto di valori univoci è la frazione di valori univoci divisa per il numero di tutti i valori distinti in una colonna. I valori univoci si verificano esattamente una volta, mentre i valori distinti si verificano almeno una volta.

Ad esempio, il set [a, a, b] contiene un valore univoco (b) e due valori distinti (a e b). Quindi il rapporto di valori univoci del set è ½ = 0,5.

Sintassi

UniqueValueRatio <COL_NAME> <EXPRESSION>
  • COL_ NAME — Il nome della colonna in base alla quale si desidera valutare la regola di qualità dei dati.

    Tipi di colonna supportati: qualsiasi tipo di colonna

  • EXPRESSION— Un'espressione da eseguire sulla risposta del tipo di regola per produrre un valore booleano. Per ulteriori informazioni, consulta Espressioni.

Esempio: rapporto di valori univoci

Questo esempio controlla il rapporto tra i valori univoci di una colonna rispetto a un intervallo di valori.

UniqueValueRatio "test_score" between 0 and 0.5 UniqueValueRatio "Customer_ID" between 0 and 0.9 where "Customer_ID < 10"

Regole dinamiche di esempio

  • UniqueValueRatio "colA" > avg(last(10))

  • UniqueValueRatio "colA" <= index(last(10),2) + std(last(5))