Definizione manuale dei metadati - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Definizione manuale dei metadati

Il AWS Glue Data Catalog è un archivio centrale che archivia i metadati relativi alle fonti e ai set di dati. Sebbene un crawler sia in grado di eseguire automaticamente la scansione e la compilazione dei metadati per le fonti di dati supportate, in alcuni scenari potrebbe essere necessario definire i metadati manualmente nel Data Catalog:

  • Formati di dati non supportati: se disponi di origini dati non supportate dal crawler, devi definire manualmente i metadati per tali fonti di dati nel Catalogo dati.

  • Requisiti personalizzati per i metadati: Crawler di AWS Glue deduce i metadati in base a regole e convenzioni predefinite. Se hai requisiti di metadati specifici che non sono coperti dai metadati Crawler di AWS Glue dedotti, puoi definire manualmente i metadati per soddisfare le tue esigenze

  • Governance e standardizzazione dei dati: in alcuni casi, potresti voler avere un maggiore controllo sulle definizioni dei metadati per motivi di governance, conformità o sicurezza dei dati. La definizione manuale dei metadati consente di garantire che i metadati aderiscano agli standard e alle politiche dell'organizzazione.

  • Segnaposto per future acquisizioni di dati: se disponi di fonti di dati che non sono immediatamente disponibili o accessibili, puoi creare tabelle di schema vuote come segnaposto. Una volta che le fonti di dati diventano disponibili, puoi popolare le tabelle con i dati effettivi, mantenendo la struttura predefinita.

Per definire i metadati manualmente, puoi utilizzare la AWS Glue console, la console Lake Formation, l' AWS Glue API o AWS Command Line Interface (AWS CLI). È possibile creare database, tabelle e partizioni e specificare proprietà dei metadati come nomi di colonne, tipi di dati, descrizioni e altri attributi.