Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Escolha de um SerDe para seus dados

Modo de foco
Escolha de um SerDe para seus dados - Amazon Athena

A tabela a seguir lista os formatos de dados compatíveis com o Athena e as bibliotecas SerDe correspondentes.

Formatos de dados e SerDes compatíveis
Formato de dados Descrição Tipos de SerDe compatíveis com o Athena
Amazon Ion O Amazon Ion é um formato de dados autodescritivo e com tipagem rica que é um superconjunto de JSON. Esse formato de código aberto foi desenvolvido pela Amazon. Use a Amazon Ion Hive SerDe.

Apache Avro

Um formato para armazenar dados no Hadoop que usa esquemas baseados em JSON para valores de registro.

Use o Avro SerDe.

Apache Parquet

Um formato para armazenamento colunar de dados no Hadoop.

Use o Parquet SerDe e a compactação SNAPPY.

Logs do Apache WebServer

Um formato para armazenar logs no Apache WebServer.

Use o Grok SerDe ou Regex SerDe.

Logs do CloudTrail

Um formato para armazenar logs no CloudTrail.

Comma-Separated Values (CSV – Valores separados por vírgula)

Em dados em formato CSV, cada linha representa um registro de dados, e cada registro consiste em um ou mais campos, separados por vírgulas.

Delimitação personalizada

Em dados nesse formato, cada linha representa um registro de dados, e os registros são separados por um delimitador de caractere único personalizado.

Use o Lazy Simple SerDe para arquivos CSV, TSV e com delimitação personalizada e especifique um delimitador de caractere único personalizado.

JSON (JavaScript Object Notation)

Em dados JSON, cada linha representa um registro de dados, e cada registro consiste em pares de atributo-valor e matrizes, separados por vírgulas.

Logs do Logstash

Um formato para armazenar logs no Logstash.

Use o Grok SerDe.

Optimized Row Columnar (ORC – Colunar de linha otimizada)

Um formato para armazenamento colunar otimizado de dados do Hive.

Use o ORC SerDe e a compactação ZLIB.

Tab-Separated Values (TSB – Valores separados por tabulação)

Em dados em formato TSV, cada linha representa um registro de dados, e cada registro consiste em um ou mais campos, separados por tabulações.

Use o Lazy Simple SerDe para arquivos CSV, TSV e com delimitação personalizada e especifique o caractere separador como FIELDS TERMINATED BY '\t'.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.