RegEx Formato dei dati - AWS Data Pipeline

AWS Data Pipeline non è più disponibile per i nuovi clienti. Clienti esistenti di AWS Data Pipeline possono continuare a utilizzare il servizio normalmente. Ulteriori informazioni

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

RegEx Formato dei dati

Un formato di dati personalizzato definito da un'espressione regolare.

Esempio

Di seguito è illustrato un esempio di questo tipo di oggetto.

{ "id" : "MyInputDataType", "type" : "RegEx", "inputRegEx" : "([^ ]*) ([^ ]*) ([^ ]*) (-|\\[[^\\]]*\\]) ([^ \"]*|\"[^\"]*\") (-|[0-9]*) (-|[0-9]*)(?: ([^ \"]*|\"[^\"]*\") ([^ \"]*|\"[^\"]*\"))?", "outputFormat" : "%1$s %2$s %3$s %4$s %5$s %6$s %7$s %8$s %9$s", "column" : [ "host STRING", "identity STRING", "user STRING", "time STRING", "request STRING", "status STRING", "size STRING", "referer STRING", "agent STRING" ] }

Sintassi

Campi opzionali Descrizione Tipo di slot
column Il nome della colonna con il tipo di dati specificato da ogni campo per i dati descritti da questo nodo di dati. Es: hostname STRING Per più valori, usa nomi di colonna e tipi di dati separati da uno spazio. Stringa
inputRegEx L'espressione regolare per analizzare un file di input S3. inputRegEx fornisce un modo per recuperare colonne da dati relativamente non strutturati in un file. Stringa
outputFormat I campi delle colonne recuperati da inputRegEx, ma a cui si fa riferimento come %1$s %2$s utilizzando la sintassi del formattatore Java. Stringa
parent Padre dell'oggetto corrente da cui saranno ereditati gli slot. Oggetto di riferimento, ad esempio «parent»: {"ref»:» Id "} myBaseObject

Campi Runtime Descrizione Tipo di slot
@version Versione della pipeline con cui l'oggetto è stato creato. Stringa

Campi di sistema Descrizione Tipo di slot
@error Errore che descrive il formato oggetto errato Stringa
@pipelineId L'id della pipeline a cui appartiene questo oggetto Stringa
@sphere La sfera di un oggetto indica la propria posizione nel ciclo di vita: i Component Objects generano Instance Objects che eseguono Attempt Objects Stringa