Eliminación de columnas - Amazon Athena

Eliminación de columnas

Es posible que sea necesario eliminar columnas de las tablas si ya no contienen datos o para restringir el acceso a los datos que contienen.

  • Puede eliminar columnas de tablas en JSON, Avro, Parquet y ORC si se leen por nombre. Para obtener más información, consulte Descripción del acceso a los índices para Apache ORC y Apache Parquet.

  • No recomendamos eliminar columnas de las tablas en CSV y TSV si se desea conservar las tablas ya creadas en Athena. La eliminación de una columna rompe el esquema y requiere que se vuelva a crear la tabla sin la columna eliminada.

En este ejemplo, se elimina una columna `totalprice` de una tabla en Parquet y se ejecuta una consulta. En Athena, el formato Parquet se lee por nombre de forma predeterminada, por lo que omitimos la configuración SERDEPROPERTIES que especifica la lectura por nombre. Observe que la consulta siguiente se realiza correctamente, aunque haya cambiado el esquema:

CREATE EXTERNAL TABLE orders_parquet_column_removed ( `o_orderkey` int, `o_custkey` int, `o_orderstatus` string, `o_orderdate` string, `o_orderpriority` string, `o_clerk` string, `o_shippriority` int, `o_comment` string ) STORED AS PARQUET LOCATION 's3://amzn-s3-demo-bucket/orders_parquet/';