Consulta de objetos de Amazon S3 Glacier restaurados - Amazon Athena

Consulta de objetos de Amazon S3 Glacier restaurados

Puede utilizar Athena para consultar objetos restaurados de las clases de almacenamiento de Amazon S3 S3 Glacier Flexible Retrieval (anteriormente Glacier) y S3 Glacier Deep Archive. Debe habilitar esta capacidad por tabla. Si no habilita la característica en una tabla antes de ejecutar una consulta, Athena omite todos los objetos de S3 Glacier Flexible Retrieval y S3 Deep Archive de la tabla durante la ejecución de la consulta.

Condiciones y limitaciones

  • La consulta de objetos de Amazon S3 Glacier restaurados solo es compatible con la versión 3 del motor de Athena.

  • La característica solo es compatible con las tablas de Apache Hive.

  • Debe restaurar los objetos antes de consultar los datos; Athena no restaura los objetos en su nombre.

Configuración de una tabla para utilizar objetos restaurados

Para configurar una tabla de Athena de modo que incluya objetos restaurados en las consultas, debe establecer su propiedad de tabla read_restored_glacier_objects en true. Para ello, puede utilizar el editor de consultas de Athena o la consola de AWS Glue. También puede utilizar la CLI de AWS Glue, la API de AWS Glue o el SDK de AWS Glue.

Uso del editor de consultas de Athena

En Athena, puede utilizar el comando ALTER TABLE SET TBLPROPERTIES para establecer la propiedad de la tabla, como en el siguiente ejemplo.

ALTER TABLE table_name SET TBLPROPERTIES ('read_restored_glacier_objects' = 'true')

Uso de la consola de AWS Glue

En la consola de AWS Glue, realice los siguientes pasos para agregar la propiedad de tabla read_restored_glacier_objects.

Para configurar propiedades de tabla en la consola de AWS Glue
  1. Inicie sesión en la AWS Management Console y abra la consola de AWS Glue en https://console.aws.amazon.com/glue/.

  2. Realice una de las siguientes acciones siguientes:

    • Elija Ir al catálogo de datos.

    • En el panel de navegación, elija Tablas del catálogo de datos.

  3. En la página Tablas, en la lista de tablas, elija el enlace de la tabla que desea editar.

  4. Seleccione Acciones, Editar la tabla.

  5. En la página Editar tabla, en la sección Propiedades de la tabla, agregue el siguiente par de clave-valor.

    • En Clave, añada read_restored_glacier_objects.

    • En Valor, introduzca true.

  6. Seleccione Guardar.

Utilizar la AWS CLI

En la AWS CLI, puede utilizar el comando AWS Glue update-table y su argumento --table-input para redefinir la tabla y, al hacerlo, agregar la propiedad read_restored_glacier_objects. En el argumento --table-input, utilice la estructura Parameters para especificar la propiedad read_restored_glacier_objects y el valor de true. Tenga en cuenta que el argumento de --table-input debe tener espacios y utilizar barras invertidas para evitar las comillas dobles. En el siguiente ejemplo, sustituya my_database y my_table por el nombre de la base de datos y la tabla.

aws glue update-table \ --database-name my_database \ --table-input={\"Name\":\"my_table\",\"Parameters\":{\"read_restored_glacier_objects\":\"true\"}}
importante

El comando update-table de AWS Glue funciona en modo de sobrescritura, lo que significa que reemplaza la definición de tabla existente por la nueva definición especificada por el parámetro table-input. Por este motivo, asegúrese de especificar también todos los campos que quiera que estén presentes en la tabla del parámetro table-input cuando añada la propiedad read_restored_glacier_objects.