Creación de consultas de CTAS en la consola de Athena - Amazon Athena

Creación de consultas de CTAS en la consola de Athena

En la consola de Athena, se puede crear una consulta CTAS a partir de otra consulta.

Para crear una consulta CTAS a partir de otra consulta
  1. Ejecute la consulta en el editor de consultas de la consola de Athena.

  2. En la parte inferior del editor de consultas, elija la opción Create (Crear) y, a continuación, elija Table from query (Tabla a partir de consulta).

  3. En el formulario Create table as select (Crear tabla basada en la selección), complete los campos como se indica a continuación:

    1. En Table name (Nombre de la tabla), ingrese el nombre de la nueva tabla. Utilice únicamente minúsculas y caracteres de subrayado, como my_select_query_parquet.

    2. En Database configuration (Configuración de la base de datos), utilice las opciones para elegir una base de datos existente o crear una.

    3. (Opcional) En Result configuration (Configuración de resultados), para Location of CTAS query results (Ubicación de los resultados de la consulta de CTAS), si la configuración de ubicación de los resultados de la consulta de grupo de trabajo no anula esta opción, haga una de las siguientes acciones:

      • Ingrese la ruta a una ubicación de S3 existente en el cuadro de búsqueda o seleccione Browse S3 (Examinar S3) para elegir una ubicación de una lista.

      • Elija View (Ver) para abrir la página Buckets (Buckets) de la consola de Amazon S3, donde podrá ver más información sobre sus buckets existentes y elegir o crear un bucket con su propia configuración.

      Debería especificar una ubicación vacía en Amazon S3 en la que se generarán los datos. Si ya existen datos en la ubicación especificada, se produce un error en la consulta.

      Si el grupo de trabajo anula la configuración del cliente para la ubicación de resultados de consulta, Athena crea la tabla en la ubicación s3://amzn-s3-demo-bucket/tables/query_id/.

    4. En Data format (Formato de datos), especifique el formato en el que se encuentran los datos.

      • Table type (Tipo de tabla): el tipo de tabla predeterminado en Athena es Apache Hive.

      • File format (Formato de archivo): elija entre opciones como CSV, TSV, JSON, Parquet u ORC. Para obtener más información sobre los formatos Parquet y ORC, consulte Uso de formatos de almacenamiento en columnas.

      • Write compression (Compresión de escritura): (opcional) elija un formato de compresión. Athena admite una variedad de formatos de compresión para leer y escribir datos, como la lectura de una tabla que utiliza varios formatos de compresión. Por ejemplo, Athena puede leer correctamente los datos de una tabla que utiliza el formato de archivo Parquet cuando algunos archivos Parquet se comprimen con Snappy y otros archivos Parquet se comprimen con GZIP. El mismo principio se aplica a los formatos de almacenamiento ORC, archivo de texto y JSON. Para obtener más información, consulte Uso de la compresión en Athena.

      • Partitions (Particiones): (opcional) seleccione las columnas que quiera particionar. La partición de los datos restringe el volumen de datos que explora cada consulta, lo que mejora el rendimiento y reduce los costos. Puede particionar datos por cualquier clave. Para obtener más información, consulte Partición de datos.

      • Buckets (Buckets): (opcional) seleccione las columnas que quiera agrupar en buckets. La agrupación en buckets es una técnica que agrupa los datos en función de columnas específicas dentro de una sola partición. Estas columnas se conocen como claves de bucket. Al agrupar los datos relacionados en un solo bucket (un archivo dentro de una partición), se reduce significativamente la cantidad de datos escaneados por Athena, lo que mejora el rendimiento de las consultas y reduce los costos. Para obtener más información, consulte Uso de particiones y asignación de buckets.

    5. En Preview table query (Vista previa de consulta de tablas), revise la consulta. Para ver la sintaxis de la consulta, consulte CREATE TABLE AS.

    6. Elija Crear tabla.

La consola de Athena tiene una plantilla SQL que también puede utilizar para crear una consulta de CTAS.

Para crear una consulta CTAS con una plantilla de SQL

Utilice la plantilla CREATE TABLE AS SELECT para crear una consulta CTAS en el editor de consultas.

  1. En la consola de Athena, junto a Tables and views (Tablas y vistas), elija Create table (Crear tabla) y, a continuación, elija CREATE TABLE AS SELECT. De este modo, se rellena el editor de consultas con una consulta CTAS con valores de marcador de posición.

  2. En el editor de consultas, edite la consulta según sea necesario. Para ver la sintaxis de la consulta, consulte CREATE TABLE AS.

  3. Elija Ejecutar.

Para ver ejemplos, consulte Ejemplos de consultas CTAS.