Usar o AWS Glue para conectar o Athena aos seus dados no Amazon S3
O Athena usa o AWS Glue Data Catalog para armazenar metadados, como nomes de tabela e de coluna para se conectar aos dados armazenados no Amazon S3. Essas informações de metadados tornam-se os bancos de dados, as tabelas e as visualizações que são exibidas no editor de consultas do Athena.
Ao usar o Athena com o AWS Glue Data Catalog, é possível usar o AWS Glue para criar bancos de dados e tabelas (esquema) para serem consultados no Athena ou usar o Athena para criar um esquema e usá-lo no AWS Glue e nos serviços relacionados.
Para definir informações de esquema para o AWS Glue, você pode usar um formulário no console do Athena, usar o editor de consultas no Athena ou criar um crawler do AWS Glue no console do AWS Glue. Os crawlers do AWS Glue inferem automaticamente o esquema de banco de dados e tabela dos seus dados do Amazon S3. Usar um formulário oferece mais personalização. Escrever suas próprias instruções CREATE TABLE
exige mais esforço, mas oferece mais controle. Para ter mais informações, consulte CREATE TABLE.
Recursos adicionais
-
Para obter mais informações sobre o AWS Glue Data Catalog, consulte Data Catalog e crawlers no AWS Glue no Guia do desenvolvedor do AWS Glue.
-
Para ver um artigo ilustrativo que mostra como usar o AWS Glue e o Athena para processar dados XML, consulte Process and analyze highly nested and large XML files using AWS Glue and Amazon Athena
no blog do AWS Big Data. -
São feitas cobranças separadas pelo uso do AWS Glue. Para obter mais informações, consulte Preços do AWS Glue
.
Tópicos
- Usar um formulário no console do Athena para adicionar uma tabela do AWS Glue
- Usar um crawler para adicionar uma tabela
- Usar a AWS CLI para recriar um banco de dados do AWS Glue e suas tabelas
- Otimizar consultas com indexação e filtragem de partições do AWS Glue
- Registrar um catálogo de dados de outra conta
- Trabalhar com dados CSV no AWS Glue
- Trabalhar com dados geoespaciais no AWS Glue
- Criação de tabelas para trabalhos de ETL