Utilice AWS Glue Data Catalog para conectarse a los datos
Athena utiliza AWS Glue Data Catalog para almacenar metadatos, como nombres de tablas y columnas para los datos almacenados en Amazon S3. Esta información de metadatos se convierte en las tablas de datos, las tablas y las vistas que aparecen en el editor de consultas de Athena.
Al utilizar Athena con el AWS Glue Data Catalog, puede usar AWS Glue para crear las bases de datos y las tablas (esquemas) que consultará en Athena, o bien puede utilizar Athena para crear un esquema y entonces utilizarlo en AWS Glue u otros servicios relacionados.
Para definir la información del esquema para AWS Glue, puede usar un formulario en la consola de Athena, usar el editor de consultas de Athena o crear un rastreador de AWS Glue en la consola de AWS Glue. Los rastreadores de AWS Glue infieren automáticamente el esquema de tablas y bases de datos des los datos que tiene en Amazon S3. El uso de un formulario ofrece una mayor personalización. Redactar sus propias instrucciones de CREATE TABLE
requiere más esfuerzo, pero ofrece más control. Para obtener más información, consulte CREATE TABLE.
Recursos adicionales
-
Para obtener más información sobre AWS Glue Data Catalog, consulte Catálogo de datos y rastreadores en AWS Glue en la Guía para desarrolladores de AWS Glue.
-
Para ver un artículo ilustrativo que muestra cómo utilizar y Athena para procesar datos XML, consulte Procesar y analizar archivos XML altamente anidados y de gran tamaño mediante AWS Glue y Amazon Athena
en el Blog de Big Data de AWS. -
AWS Glue está sujeto a cargos por separado. Para más información, consulte Precios de AWS Glue
.
Temas
- Registro y uso de catálogos de datos en Athena
- Registrar un catálogo de datos desde otra cuenta
- Control del acceso a los catálogos de datos con políticas de IAM
- Utilice un formulario de la consola de Athena para agregar una tabla de AWS Glue
- Utilice un rastreador para agregar una tabla
- Optimización de las consultas con indexación y filtrado de particiones de AWS Glue
- Usar la AWS CLI para recrear una base de datos de AWS Glue y sus tablas
- Creación de tablas para los trabajos de ETL
- Trabajar con datos CSV en AWS Glue
- Uso de datos geoespaciales en AWS Glue