Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Un classificatore determina lo schema dei dati. Puoi scrivere un classificatore personalizzato e puntarvi da AWS Glue.
Creazione dei classificatori
Per aggiungere un classificatore nella console AWS Glue, scegli Add classifier (Aggiungi classificatore). Quando definisci un classificatore, specifichi i valori per le seguenti opzioni:
-
Classifier name (Nome del classificatore) – Fornisci un nome univoco per il tuo classificatore.
-
Classifier type (Tipo di classificazione) – Il tipo di classificazione delle tabelle dedotte dal classificatore.
-
Last updated (Ultimo aggiornamento) – L'ultima volta in cui è stato aggiornato il classificatore.
- Nome del classificatore
-
Fornisci un nome univoco per il tuo classificatore.
- Tipo di classificatore
-
Scegli il tipo di classificatore da creare.
A seconda del tipo di classificatore scelto, configurare le seguenti proprietà per il classificatore:
-
Classificazione
Descrivi il formato o il tipo di dati classificati o fornisci un'etichetta personalizzata.
-
Pattern grok
Viene utilizzato per analizzare i dati in uno schema strutturato. Il pattern grok è composto da modelli denominati che descrivono il formato del datastore. Puoi scrivere questo pattern grok usando il modello predefinito denominato fornito da AWS Glue e i modelli personalizzati che scrivi e includi nel campo Custom patterns (Modelli personalizzati). Anche se i risultati dei debugger grok potrebbero non corrispondere esattamente ai risultati di AWS Glue, ti consigliamo di provare il modello usando alcuni dati di esempio con un debugger grok. Puoi trovare i debugger grok sul Web. I modelli predefiniti denominati forniti da AWS Glue sono generalmente compatibili con i modelli grok disponibili nel Web.
Crea il tuo pattern grok aggiungendo iterativamente i modelli denominati e controlla i risultati in un debugger. Questa attività garantisce che i dati vengano analizzati quando il crawler AWS Glue esegue il pattern grok.
-
Pattern personalizzati
Per i classificatori grok, questi sono elementi costitutivi facoltativi per il Grok pattern (Pattern grok) che scrivi. Quando i modelli integrati non sono in grado di analizzare i dati, potrebbe essere necessario scrivere un modello personalizzato. Questi modelli personalizzati sono definiti in questo campo e referenziati nel campo Grok pattern (Pattern grok). Ciascun modello personalizzato è definito su una riga separata. Proprio come i modelli integrati, è costituito da una definizione di modello denominato che utilizza la sintassi di espressione regolare (regex)
. Ad esempio, di seguito è riportato il nome
MESSAGEPREFIX
seguito da una definizione di espressione regolare da applicare ai dati per determinare se segue il modello.MESSAGEPREFIX .*-.*-.*-.*-.*
Per ulteriori informazioni, consulta Scrittura di classificatori personalizzati per diversi formati di dati.
Visualizzazione dei classificatori
Per visualizzare un elenco di tutti i classificatori che hai creato, apri la AWS Glue console all'indirizzo e scegli la https://console.aws.amazon.com/glue/
Nell'elenco sono riportate le seguenti proprietà per ogni classificatore:
-
Classifier (Classificatore) – Il nome del classificatore. Quando crei un classificatore, devi specificarne il nome.
-
Classification (Classificazione) – Il tipo di classificazione delle tabelle dedotte dal classificatore.
-
Last updated (Ultimo aggiornamento) – L'ultima volta in cui è stato aggiornato il classificatore.
Gestione dei classificatori
Nell'elenco Classifiers (Classificatori) nella console AWS Glue puoi aggiungere, modificare ed eliminare classificatori. Per visualizzare ulteriori dettagli per un classificatore, scegli il nome nell'elenco. I dettagli sono le informazioni cha hai definito al momento della creazione del classificatore.