Integración de tablas de Amazon S3 con información general de servicios de análisis de AWS - Amazon Simple Storage Service

Integración de tablas de Amazon S3 con información general de servicios de análisis de AWS

Para que los servicios de análisis de AWS puedan acceder a las tablas de su cuenta, integre los buckets de tablas de Amazon S3 con Amazon SageMaker Lakehouse. Esta integración permite que los servicios de análisis de AWS detecten automáticamente los datos de las tablas y accedan a ellos. Puede utilizar esta integración para trabajar con las tablas en estos servicios:

nota

Esta integración utiliza los servicios de AWS Glue y AWS Lake Formation, y puede incurrir en costos de solicitudes y almacenamiento de AWS Glue. Para más información, consulte Precios de AWS Glue.

Se aplican precios adicionales por ejecutar consultas en las tablas de S3. Para obtener más información, consulte la información de precios del motor de consulta que está utilizando.

Cómo funciona la integración

Cuando crea un bucket de tablas en la consola, Amazon S3 inicia las siguientes acciones para integrar los buckets de tablas en la región que ha seleccionado con los servicios de análisis de AWS:

  1. Crea un nuevo rol de servicio de AWS Identity and Access Management (IAM) que le da a Lake Formation acceso a todos los buckets de tablas.

  2. Mediante el rol de servicio, Lake Formation registra los buckets de tablas en la región actual. Esto permite a Lake Formation administrar el acceso, los permisos y la gobernanza de todos los buckets de tablas actuales y futuros en esa región.

  3. Agrega el catálogo s3tablescatalog al AWS Glue Data Catalog en la región actual. Agregar el catálogo de s3tablescatalog permite que todos los buckets de tablas, espacios de nombres y tablas se rellenen en el Catálogo de datos.

nota

Estas acciones se automatizan mediante la consola de Amazon S3. Si realiza esta integración mediante programación, debe realizar todas estas acciones manualmente.

Integre los buckets de tablas una vez por región de AWS. Una vez completada la integración, todos los buckets de tablas, espacios de nombres y tablas actuales y futuros se agregan a AWS Glue Data Catalog en esa región.

La siguiente ilustración muestra cómo el catálogo de s3tablescatalog rellena automáticamente los buckets de tablas, los espacios de nombres y las tablas de la región actual como los objetos correspondientes en el Catálogo de datos. Los buckets de tablas se rellenan como subcatálogos. Los espacios de nombres de un bucket de tablas se rellenan como bases de datos dentro de sus respectivos subcatálogos. Las tablas se rellenan como tablas en las respectivas bases de datos.

Las formas en las que se representan los recursos de tabla en AWS Glue Data Catalog.
Funcionamiento de los permisos

Recomendamos integrar los buckets de tablas con los servicios de análisis de AWS para poder trabajar con datos de tablas en todos los servicios que utilizan el AWS Glue Data Catalog como almacén de metadatos. La integración permite el control de acceso pormenorizado a través de AWS Lake Formation. Este enfoque de seguridad significa que, además de los permisos de AWS Identity and Access Management (IAM), debe conceder a su entidad principal de IAM permisos de Lake Formation en sus tablas antes de poder trabajar con ellas.

Hay dos tipos principales de permisos en AWS Lake Formation:

  • Los permisos de acceso a metadatos controlan la capacidad de crear, leer, actualizar y eliminar bases de datos de metadatos y tablas del Catálogo de datos.

  • Los permisos de acceso a los datos subyacentes controlan la capacidad de leer y escribir datos en las ubicaciones de Amazon S3 subyacentes a las que apuntan los recursos del Catálogo de datos.

Lake Formation utiliza una combinación de su propio modelo de permisos y el modelo de permisos de IAM para controlar el acceso a los recursos del Catálogo de datos y a los datos subyacentes.

  • Para que una solicitud de acceso a los recursos del Catálogo de datos o a los datos subyacentes se atienda correctamente, debe pasar las comprobaciones de permisos tanto de IAM como de Lake Formation.

  • Los permisos de IAM controlan el acceso a las API y recursos de Lake Formation y AWS Glue, mientras que los permisos de Lake Formation controlan el acceso a los recursos del Catálogo de datos, las ubicaciones de Amazon S3 y los datos subyacentes.

Los permisos de Lake Formation se aplican solo en la región en la que se concedieron, y la entidad principal debe estar autorizada por un administrador de lago de datos o de otra entidad principal con los permisos necesarios para que se le concedan permisos de Lake Formation.

Para obtener más información, consulte Descripción general de permisos de Lake Formation en la Guía para desarrolladores de AWS Lake Formation.

Asegúrese de seguir los pasos que se indican en Integración de tablas de S3 con servicios de análisis de AWS para disponer de los permisos adecuados para acceder a AWS Glue Data Catalog y a los recursos de tabla, así como para trabajar con los servicios de análisis de AWS.

Pasos a seguir a continuación