Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Registro de catálogos de buckets de tabla de S3 en Athena

Modo de enfoque
Registro de catálogos de buckets de tabla de S3 en Athena - Amazon Athena

Los buckets de tabla de S3 son un tipo de bucket de Amazon S3 diseñado específicamente para almacenar datos tabulares en tablas de Apache Iceberg. Los buckets de tablas automatizan tareas de administración de tablas, como la compactación, la administración de instantáneas y la recopilación de elementos no utilizados, para optimizar continuamente el rendimiento de las consultas y minimizar los costos. Tanto si recién comienza como si cuenta con miles de tablas en el entorno de Iceberg, los buckets de tabla simplifican el uso de los lagos de datos a cualquier escala. Para obtener más información, consulte buckets de tabla.

Consideraciones y limitaciones

  • No se admiten operaciones DDL, como CREATE TABLE, CREATE TABLE AS SELECT, CREATE VIEW, etc.

  • Se admiten operaciones de lectura y escritura como, SELECT, INSERT, UPDATE, DELETE y MERGE.

  • Athena no admite CREATE TABLE en buckets de tablas de S3, por lo que la configuración inicial se debe realizar con otro motor, como Spark en EMR, o mediante la API de tablas de S3.

  • No se admite la reutilización del resultado de la consulta.

  • Si se produce el error Invalid choice: 's3tables' al utilizar la CLI, asegúrese de actualizar a la versión de AWS CLI más reciente.

Configuración previa a la consulta del bucket de tablas de S3 desde Athena

Complete estos requisitos previos antes de consultar el bucket de tablas de S3 desde Athena
  1. Cree un bucket de tabla de S3. Para obtener más información, consulte Cómo crear un bucket de tabla en la Guía del usuario de Amazon Simple Storage Service.

  2. Cree un espacio de nombres de tabla. Para obtener más información, consulte Cómo crear un espacio de nombres en la Guía del usuario de Amazon Simple Storage Service.

  3. Para crear una tabla de S3, siga los pasos que se indican en Cómo crear una tabla de Amazon S3.

  4. Asegúrese de que la integración de los buckets de tabla con AWS Glue Data Catalog y AWS Lake Formation se realiza correctamente. Para ello, siga los pasos que se indican en Requisitos previos para la integración e Integración de buckets de tabla con servicios de análisis de AWS en la Guía del usuario de Amazon Simple Storage Service.

    nota

    Si habilitó la integración al crear un bucket de tablas de S3 desde la consola de S3 en el paso 1, puede omitir este paso.

  5. En el caso del usuario/rol que desea utilizar para enviar la consulta desde Athena, conceda permiso a Lake Formation sobre la tabla de S3, ya sea a través de la consola de Lake Formation o CLI.

    Console
    1. Abra la consola de AWS Lake Formation en https://console.aws.amazon.com/lakeformation/ e inicie sesión como administrador del lago de datos. Para obtener más información sobre cómo crear un administrador del lago de datos, consulte Cómo crear un administrador del lago de datos.

    2. En el panel de navegación, elija Permisos de datos y, a continuación, seleccione Conceder.

    3. En la página Conceder permisos, en Entidades principales, elija la entidad principal que desea utilizar para enviar consultas desde Athena.

    4. En Etiquetas LF o recursos de catálogo, elija Recursos de catálogo de datos con nombre.

    5. En Catálogos, elija un catálogo de datos de Glue que haya creado a partir de la integración del bucket de tablas. Por ejemplo, <accoundID>:s3tablescatalog/amzn-s3-demo-bucket.

    6. En Bases de datos, elija el espacio de nombres de la tabla de S3 que creó. Athena utiliza el espacio de nombres de la tabla de S3 como base de datos.

    7. En Tablas, elija la tabla de S3 que creó en el bucket de tablas de S3.

    8. En Permisos de tabla, seleccione Super.

    9. Elija Conceder.

    CLI
    1. Asegúrese de que ejecuta el comando de la AWS CLI como administrador del lago de datos. Para obtener más información, consulte Cómo crear un administrador de lago de datos.

    2. Ejecute el siguiente comando para conceder a Lake Formation permiso sobre la tabla en la tabla de S3 para permitir que el usuario/rol envíe la consulta desde Athena.

      aws lakeformation grant-permissions \ --region <region e.g. us-east-1> \ --cli-input-json \ '{ "Principal": { "DataLakePrincipalIdentifier": "<user or role ARN e.g. arn:aws:iam::<Account ID>:role/ExampleRole>" }, "Resource": { "Table": { "CatalogId": "<Account ID>:s3tablescatalog/amzn-s3-demo-bucket", "DatabaseName": "<S3 table namespace e.g. test_namespace>", "Name": "<S3 table name e.g. test_table>" } }, "Permissions": [ "ALL" ] }'
    1. Abra la consola de AWS Lake Formation en https://console.aws.amazon.com/lakeformation/ e inicie sesión como administrador del lago de datos. Para obtener más información sobre cómo crear un administrador del lago de datos, consulte Cómo crear un administrador del lago de datos.

    2. En el panel de navegación, elija Permisos de datos y, a continuación, seleccione Conceder.

    3. En la página Conceder permisos, en Entidades principales, elija la entidad principal que desea utilizar para enviar consultas desde Athena.

    4. En Etiquetas LF o recursos de catálogo, elija Recursos de catálogo de datos con nombre.

    5. En Catálogos, elija un catálogo de datos de Glue que haya creado a partir de la integración del bucket de tablas. Por ejemplo, <accoundID>:s3tablescatalog/amzn-s3-demo-bucket.

    6. En Bases de datos, elija el espacio de nombres de la tabla de S3 que creó. Athena utiliza el espacio de nombres de la tabla de S3 como base de datos.

    7. En Tablas, elija la tabla de S3 que creó en el bucket de tablas de S3.

    8. En Permisos de tabla, seleccione Super.

    9. Elija Conceder.

  6. Envíe una consulta desde Athena con el usuario/rol concedido anteriormente. En este ejemplo, s3tablescatalog es el catálogo de datos de Glue principal creado a partir de la integración y s3tablescatalog/amzn-s3-demo-bucket es el catálogo de datos de Glue secundario creado para cada bucket de tabla de S3. Existen dos formas de realizar la consulta.

    • Especifique el catálogo de Glue secundario (s3tablescatalog/amzn-s3-demo-bucket) como catálogo directamente. Puede hacerlo a través de la consola o con la AWS CLI.

      Console
      CLI

      Ejecute el siguiente comando de la .

      aws athena start-query-execution \ --query-string 'SELECT * FROM "s3tablescatalog/amzn-s3-demo-bucket"."test_namespace"."test_table" LIMIT 10' \ --work-group "primary"
    • Cree un catálogo de datos de Athena a partir del catálogo de datos de Glue secundario en la consola de Athena y especifíquelo como catálogo en la consulta. Para obtener más información, consulte Cómo registrar catálogos de buckets de tabla de S3 con la consola de Athena.

Cómo registrar catálogos de buckets de tabla de S3 con la consola de Athena

Para registrar catálogos de buckets de tabla de S3 en la consola de Athena, siga estos pasos.

  1. Abra la consola de Athena en https://console.aws.amazon.com/athena/.

  2. En el panel de navegación, elija Orígenes de datos y catálogos.

  3. En la página Orígenes de datos y catálogos, elija Crear origen de datos.

  4. En Elegir un origen de datos, elija Amazon S3: AWS Glue Data Catalog.

  5. En la sección AWS Glue Data Catalog, bajo Cuenta de origen de datos, elija AWS Glue Data Catalog en esta cuenta.

  6. En Crear una tabla o registrar un catálogo, elija Registrar un nuevo catálogo de AWS Glue.

  7. En la sección Detalles del origen de datos, en Nombre del origen de datos, ingrese el nombre que desea utilizar para especificar el origen de datos en las consultas SQL o utilice el nombre predeterminado que se genera.

  8. En Catálogo, seleccione Examinar para buscar una lista de catálogos de AWS Glue en la misma cuenta. Si no ve ningún catálogo existente, cree uno en la consola de AWS Glue.

  9. En el cuadro de diálogo Examinar catálogos de AWS Glue, seleccione el catálogo que desea utilizar y, a continuación, elija Seleccionar.

  10. (Opcional) En Etiquetas, ingrese cualquier par de clave/valor que desee asociar al origen de datos.

  11. Elija Siguiente.

  12. En la página Revisar y crear, compruebe que la información introducida es correcta y, a continuación, seleccione Crear origen de datos.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.