Exemplos de consultas CTAS

Modo de foco

Exemplos de consultas CTAS - Amazon Athena

Use os exemplos a seguir para criar consultas CTAS. Para obter informações sobre a sintaxe de CTAS, consulte CREATE TABLE AS.

Nesta seção:

Example: Duplicating a table by selecting all columns
Example: Selecting specific columns from one or more tables
Example: Creating an empty copy of an existing table
Example: Specifying data storage and compression formats
Example: Writing query results to a different format
Example: Creating unpartitioned tables
Example: Creating partitioned tables
Example: Creating bucketed and partitioned tables
Example: Creating an Iceberg table with Parquet data
Example: Creating an Iceberg table with Avro data

exemplo
Exemplo: duplicar tabela selecionando todas as colunas

O exemplo a seguir cria uma tabela copiando todas as colunas de uma tabela:


CREATE TABLE new_table AS 
SELECT * 
FROM old_table;

Na seguinte variação do mesmo exemplo, a instrução SELECT também inclui uma cláusula WHERE. Nesse caso, a consulta seleciona somente as linhas da tabela que satisfazem a cláusula WHERE:


CREATE TABLE new_table AS 
SELECT * 
FROM old_table 
WHERE condition;

exemplo
Exemplo: selecionar colunas específicas de uma ou mais tabelas

O exemplo a seguir cria uma consulta que é executada em um conjunto de colunas de outra tabela:


CREATE TABLE new_table AS 
SELECT column_1, column_2, ... column_n 
FROM old_table;

Essa variação do mesmo exemplo cria uma tabela a partir de colunas específicas de várias tabelas:


CREATE TABLE new_table AS
SELECT column_1, column_2, ... column_n 
FROM old_table_1, old_table_2, ... old_table_n;

exemplo
Exemplo: criar uma cópia vazia de uma tabela existente

O exemplo a seguir usa WITH NO DATA para criar uma tabela vazia e que tenha o mesmo esquema da tabela original:


CREATE TABLE new_table 
AS SELECT * 
FROM old_table
WITH NO DATA;

exemplo
Exemplo: especificar armazenamento de dados e formatos de compactação

Com a CTAS, é possível usar a tabela de origem para criar outra tabela em um formato diferente.

Use a propriedade format para especificar ORC, PARQUET, AVRO, JSON ou TEXTFILE como o formato de armazenamento para a nova tabela.

Para os formatos de armazenamento PARQUET, ORC, TEXTFILE e JSON, use a propriedade write_compression para especificar o formato de compactação para os dados da nova tabela. Para obter mais informações sobre os formatos de compactação suportados por cada formato de arquivo, consulte Usar compactação no Athena.

O exemplo a seguir especifica que os dados na tabela new_table são armazenados em formato Parquet e usam compactação Snappy. A compactação padrão para Parquet é GZIP.


CREATE TABLE new_table
WITH (
      format = 'Parquet',
      write_compression = 'SNAPPY')
AS SELECT *
FROM old_table;

O exemplo a seguir especifica que os dados na tabela new_table são armazenados em formato ORC e usam compactação Snappy. A compactação padrão para ORC é ZLIB.


CREATE TABLE new_table
WITH (format = 'ORC',
      write_compression = 'SNAPPY')
AS SELECT *
FROM old_table ;

O exemplo a seguir especifica esses dados na tabela new_table são armazenados em formato textfile usando a compactação Snappy. A compactação padrão para os formatos textfile e JSON é GZIP.


CREATE TABLE new_table
WITH (format = 'TEXTFILE',
      write_compression = 'SNAPPY')
AS SELECT *
FROM old_table ;

exemplo
Exemplo: gravar resultados da consulta em um formato diferente

A seguinte consulta CTAS seleciona todos os registros de old_table, que poderiam ser armazenados em CSV ou em outro formato, e cria uma nova tabela com os dados subjacentes salvos no Amazon S3 no formato ORC:


CREATE TABLE my_orc_ctas_table
WITH (
      external_location = 's3://amzn-s3-demo-bucket/my_orc_stas_table/',
      format = 'ORC')
AS SELECT * 
FROM old_table;

exemplo
Exemplo: criar tabelas não particionadas

Os exemplos a seguir criam tabelas que não são particionadas. Os dados da tabela são armazenados em formatos diferentes. Alguns desses exemplos especificam o local externo.

O exemplo a seguir cria uma consulta CTAS que armazena os resultados como um arquivo de texto:


CREATE TABLE ctas_csv_unpartitioned 
WITH (
     format = 'TEXTFILE', 
     external_location = 's3://amzn-s3-demo-bucket/ctas_csv_unpartitioned/') 
AS SELECT key1, name1, address1, comment1
FROM table1;

No exemplo a seguir, os resultados são armazenados em Parquet, e os local padrão dos resultados é usado:


CREATE TABLE ctas_parquet_unpartitioned 
WITH (format = 'PARQUET') 
AS SELECT key1, name1, comment1
FROM table1;

No a consulta a seguir, a tabela é armazenada em JSON, e colunas específicas são selecionadas entre os resultados da tabela original:


CREATE TABLE ctas_json_unpartitioned 
WITH (
     format = 'JSON',  
     external_location = 's3://amzn-s3-demo-bucket/ctas_json_unpartitioned/') 
AS SELECT key1, name1, address1, comment1
FROM table1;

No exemplo a seguir, o formato é ORC:


CREATE TABLE ctas_orc_unpartitioned 
WITH (
     format = 'ORC') 
AS SELECT key1, name1, comment1 
FROM table1;

No exemplo a seguir, o formato é Avro:


CREATE TABLE ctas_avro_unpartitioned 
WITH (
     format = 'AVRO', 
     external_location = 's3://amzn-s3-demo-bucket/ctas_avro_unpartitioned/') 
AS SELECT key1, name1, comment1
FROM table1;

exemplo
Exemplo: criar tabelas particionadas

Os exemplos a seguir mostram consultas CREATE TABLE AS SELECT para tabelas particionadas em diferentes formatos de armazenamento, usando partitioned_by e outras propriedades na cláusula WITH. Para ver a sintaxe, consulte Propriedades da tabela CTAS. Para obter mais informações sobre como escolher as colunas para particionamento, consulte Usar particionamento e bucketing.

nota

Liste as colunas da partição no final da lista de colunas na instrução SELECT. Você pode particionar por mais de uma coluna e ter até 100 combinações únicas de partições e buckets. Por exemplo, você pode ter 100 partições se nenhum bucket for especificado.


CREATE TABLE ctas_csv_partitioned 
WITH (
     format = 'TEXTFILE',  
     external_location = 's3://amzn-s3-demo-bucket/ctas_csv_partitioned/', 
     partitioned_by = ARRAY['key1']) 
AS SELECT name1, address1, comment1, key1
FROM tables1;


CREATE TABLE ctas_json_partitioned 
WITH (
     format = 'JSON', 
     external_location = 's3://amzn-s3-demo-bucket/ctas_json_partitioned/', 
     partitioned_by = ARRAY['key1']) 
AS select name1, address1, comment1, key1 
FROM table1;

exemplo
Exemplo: criar tabelas em bucket e particionadas

O exemplo a seguir mostra uma consulta CREATE TABLE AS SELECT que usa tanto o particionamento quanto o armazenamento em bucket para armazenar os resultados das consultas no Amazon S3. Os resultados da tabela são particionados e armazenados em bucket por diferentes colunas. O Athena permite no máximo 100 combinações únicas de bucket e partição. Por exemplo, se você criar uma tabela com cinco buckets, é possível ter 20 partições com cinco buckets cada. Para ver a sintaxe, consulte Propriedades da tabela CTAS.

Para obter mais informações sobre como escolher as colunas para armazenamento em bucket, consulte Usar particionamento e bucketing.


CREATE TABLE ctas_avro_bucketed 
WITH (
      format = 'AVRO', 
      external_location = 's3://amzn-s3-demo-bucket/ctas_avro_bucketed/', 
      partitioned_by = ARRAY['nationkey'], 
      bucketed_by = ARRAY['mktsegment'], 
      bucket_count = 3) 
AS SELECT key1, name1, address1, phone1, acctbal, mktsegment, comment1, nationkey 
FROM table1;

exemplo
Exemplo: criação de uma tabela do Iceberg com dados do Parquet

O exemplo a seguir cria uma tabela do Iceberg com arquivos de dados do Parquet. Os arquivos são particionados por mês usando a coluna dt na table1. O exemplo atualiza as propriedades de retenção na tabela para que dez snapshots sejam retidos, por padrão, em cada ramificação da tabela. Os snapshots dos últimos 7 dias também são retidos. Para obter mais informações sobre as propriedades de tabelas Iceberg no Athena, consulte Especificar propriedades das tabelas.


CREATE TABLE ctas_iceberg_parquet
WITH (table_type = 'ICEBERG',
      format = 'PARQUET', 
      location = 's3://amzn-s3-demo-bucket/ctas_iceberg_parquet/', 
      is_external = false,
      partitioning = ARRAY['month(dt)'],
      vacuum_min_snapshots_to_keep = 10,
      vacuum_max_snapshot_age_seconds = 604800
   ) 
AS SELECT key1, name1, dt FROM table1;

exemplo
Exemplo: criação de uma tabela do Iceberg com dados do Avro

O exemplo a seguir cria uma tabela do Iceberg com arquivos de dados do Avro particionados por key1.


CREATE TABLE ctas_iceberg_avro
WITH ( format = 'AVRO', 
       location = 's3://amzn-s3-demo-bucket/ctas_iceberg_avro/', 
       is_external = false,
       table_type = 'ICEBERG',
       partitioning = ARRAY['key1']) 
AS SELECT key1, name1, date FROM table1;

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Criar consultas CTAS

Usar CTAS e INSERT INTO para ETL

Próximo tópico:

Usar CTAS e INSERT INTO para ETL

Tópico anterior:

Criar consultas CTAS

Precisa de ajuda?

Esta página foi útil?

Fornecer feedback

Privacidade Termos do site Preferências de cookies

Selecione suas preferências de cookies

Exemplos de consultas CTAS

exemplo Exemplo: duplicar tabela selecionando todas as colunas

exemplo Exemplo: selecionar colunas específicas de uma ou mais tabelas

exemplo Exemplo: criar uma cópia vazia de uma tabela existente

exemplo Exemplo: especificar armazenamento de dados e formatos de compactação

exemplo Exemplo: gravar resultados da consulta em um formato diferente

exemplo Exemplo: criar tabelas não particionadas

exemplo Exemplo: criar tabelas particionadas