JSON Hive SerDe

Modalità Focus

JSON Hive SerDe - Amazon Athena

Specificate i formati di timestamp con Hive JSON SerDe Carica la tabella per l'interrogazione Registri delle CloudTrail interrogazioni

Hive JSON SerDe è comunemente usato per elaborare dati JSON come eventi. Questi eventi sono rappresentati come stringhe su una sola riga di testo con codifica JSON separati da una nuova riga. Hive JSON SerDe non consente la duplicazione di chiavi o nomi di chiavi. map struct

Nota

SerDe Si aspetta che ogni documento JSON si trovi su una singola riga di testo senza caratteri di terminazione di riga che separano i campi del record. Se il testo JSON è in un bel formato di stampa, potresti ricevere un messaggio di errore come HIVE_CURSOR_ERROR: Row is not a valid JSON Object o HIVE_CURSOR_ERROR:: Unexpected end-of-input: expected: expected close marker for OBJECT quando tenti di interrogare la tabella dopo averla JsonParseException creata. Per ulteriori informazioni, consulta JSON Data Files nella documentazione di SerDe OpenX su. GitHub

L'istruzione DDL di esempio seguente utilizza Hive JSON SerDe per creare una tabella basata su esempi di dati pubblicitari online. Nella LOCATION clausola, sostituisci myregion in s3://amzn-s3-demo-bucket.elasticmapreduce/samples/hive-ads/tables/impressions con l'identificatore di regione in cui esegui Athena (ad esempio,). s3://us-west-2.elasticmapreduce/samples/hive-ads/tables/impressions


CREATE EXTERNAL TABLE impressions (
    requestbegintime string,
    adid string,
    impressionid string,
    referrer string,
    useragent string,
    usercookie string,
    ip string,
    number string,
    processid string,
    browsercookie string,
    requestendtime string,
    timers struct
                <
                 modellookup:string, 
                 requesttime:string
                >,
    threadid string, 
    hostname string,
    sessionid string
)   
PARTITIONED BY (dt string)
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
LOCATION 's3://amzn-s3-demo-bucket.elasticmapreduce/samples/hive-ads/tables/impressions';

Specificate i formati di timestamp con Hive JSON SerDe

Per analizzare i valori del timestamp dalla stringa, è possibile aggiungere il sottocampo WITH SERDEPROPERTIES per la clausola ROW FORMAT SERDE e usarla per specificare il parametro timestamp.formats. Nel parametro specifica un elenco separato da virgole di uno o più modelli di timestamp, come nell'esempio seguente:


...
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
WITH SERDEPROPERTIES ("timestamp.formats"="yyyy-MM-dd'T'HH:mm:ss.SSS'Z',yyyy-MM-dd'T'HH:mm:ss")
...

Per ulteriori informazioni, consulta Marche temporali nella documentazione di Apache Hive.

Carica la tabella per l'interrogazione

Dopo aver creato la tabella, eseguire MSCK REPAIR TABLE per caricare la tabella e renderla eseguibile da Athena:


MSCK REPAIR TABLE impressions

Registri delle CloudTrail interrogazioni

È possibile utilizzare Hive JSON SerDe per interrogare i log. CloudTrail Per ulteriori informazioni ed esempi delle istruzioni CREATE TABLE, consulta la pagina AWS CloudTrail Registri delle interrogazioni.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Librerie JSON SerDe

OpenX JSON SerDe

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

JSON Hive SerDe

Nota

Specificate i formati di timestamp con Hive JSON SerDe

Carica la tabella per l'interrogazione

Registri delle CloudTrail interrogazioni

In questa pagina

Questa pagina ti è stata utile?

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?