Entropia - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Entropia

Verifica se il valore di entropy di una colonna corrisponde a una determinata espressione. L'entropia misura il livello di informazioni contenute in un messaggio. Data la distribuzione della probabilità sui valori in una colonna, l'entropia descrive quanti bit sono necessari per identificare un valore.

Sintassi

Entropy <COL_NAME> <EXPRESSION>
  • COL_ NAME — Il nome della colonna in base alla quale si desidera valutare la regola di qualità dei dati.

    Tipi di colonna supportati: qualsiasi tipo di colonna

  • EXPRESSION— Un'espressione da eseguire sulla risposta del tipo di regola per produrre un valore booleano. Per ulteriori informazioni, consulta Espressioni.

Esempio: entropia delle colonne

La seguente regola di esempio verifica che la colonna denominata Feedback abbia un valore di entropia maggiore di uno.

Entropy "Star_Rating" > 1 Entropy "First_Name" > 1 where "Customer_ID < 10"

Regole dinamiche di esempio

  • Entropy "colA" < max(last(10))

  • Entropy "colA" between min(last(10)) and max(last(10))