Trabajar con otros AWS servicios - AWS Lake Formation

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Trabajar con otros AWS servicios

AWS servicios como Amazon Athena AWS Glue, Amazon Redshift Spectrum y Amazon EMR se pueden AWS Lake Formation utilizar para acceder de forma segura a los datos de las ubicaciones de Amazon S3 registradas en Lake Formation. Con Lake Formation, puede definir y administrar permisos detallados de control de acceso (FGAC) para sus tablas en el. AWS Glue Data Catalog Cada uno de estos AWS servicios es una persona de confianza que llama a Lake Formation, y Lake Formation proporciona acceso a los datos almacenados en Amazon S3 mediante credenciales temporales. Para obtener más información, consulte Cómo funciona la integración de aplicaciones de Lake Formation.

Para aprovechar estas prestaciones, Lake Formation requiere que antes registre la ubicación de Amazon S3 y asigne los permisos adecuados a la entidad principal de IAM para acceder a la tabla, la base de datos y la ubicación de Amazon S3. Para obtener más información, consulte Administrar los permisos de Lake Formation.

En las siguientes tablas, se enumeran los tipos de permisos de Lake Formation que admiten Amazon Athena, AWS Glue Amazon EMR y Amazon Redshift Spectrum para acceder a datos AWS Glue de tablas estándar y tablas transaccionales (Apache Iceberg, Apache Hudi y Delta Lake de la fundación Linux) con datos almacenados en Amazon S3 y metadatos de tablas en el catálogo de datos.

AWS servicios y tipos de permisos compatibles para tablas y vistas estándar AWS Glue
AWS servicio permisos a nivel de tabla Permisos a nivel de columna Permisos a nivel de fila y celda
Athena SQL

Acceso de lectura/escritura

Acceso de lectura Acceso de lectura
Athena para Spark

No admitido

No admitido

No admitido

Redshift Spectrum en un clúster aprovisionado o Amazon Redshift sin servidor

Acceso de lectura/escritura Acceso de lectura Acceso de lectura

Apache Spark en Amazon EMR (EC2)

Acceso de lectura/escritura Acceso de lectura Acceso de lectura
Apache Hive en Amazon EMR (EC2) Acceso de lectura/escritura Acceso de lectura No compatible
Apache Spark en EMR sin servidor Acceso de lectura/escritura Acceso de lectura Acceso de lectura
Apache Hive en EMR sin servidor No admitido No admitido No admitido
Amazon EMR en EKS No admitido No admitido No admitido
AWS Glue ETL Acceso de lectura/escritura No admitido No admitido
Consideraciones y limitaciones
  • Athena Spark no admite la consulta de tablas del catálogo de datos con permisos de Lake Formation.

  • Los usuarios de Athena basados en SAML pueden leer las fuentes de datos protegidas mediante los permisos de Lake Formation al habilitar la federación basada en SAML 2.0. Los usuarios de SAML pueden insertar datos en las tablas de Parquet.

  • Apache Spark en EMR Serverless no admite la consulta de vistas del catálogo de datos.

  • Apache Hive en EMR Serverless no admite la consulta de tablas con permisos de Lake Formation.

  • AWS Glue ETL requiere acceso total a toda la tabla mientras recupera los datos de la ubicación subyacente de Amazon S3. AWS Glue El trabajo de ETL falla si se aplican permisos a nivel de columna a una tabla.

AWS servicios y tipos de permisos compatibles para los formatos de tablas transaccionales
AWS servicio Iceberg Hudi Delta Lake (nativo) Delta Lake (tablas de enlaces simbólicos)

Athena SQL

Admite la lectura de tablas con permisos de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso total a las tablas.

Admite operaciones de lectura y creación en tablas con permisos a nivel de tabla, columna, fila y celda. No se admiten las operaciones de escritura.

Athena (versión 3 del motor) admite la lectura de tablas nativas de Delta Lake con permisos de tabla, columna, fila y celda. No se admiten operaciones de escritura.

Athena (versión 3 del motor) admite la lectura de tablas de enlaces simbólicos de Delta Lake con permisos de tabla, columna, fila y celda. No se admiten operaciones de escritura.

Redshift Spectrum en un clúster aprovisionado

Admite la lectura de tablas con permisos a nivel de tabla, columna, fila y celda. No se admiten operaciones de escritura.

Admite la lectura de tablas con permisos de tabla, columna, fila y celda. No se admiten operaciones de escritura.

No se admite Admite la lectura de tablas de Delta Lake mediante un manifiesto de enlace simbólico con permisos de tabla, columna, fila y celda. No se admiten operaciones de escritura.
Apache Spark en Amazon EMR (EC2) Admite la lectura de tablas con permisos a nivel de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso total a las tablas. Admite la lectura de tablas con permisos a nivel de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso total a las tablas.

Admite la lectura de tablas con permisos a nivel de tabla, columna, fila y celda. No se admiten operaciones de escritura.

Admite la lectura de tablas con permisos de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso total a las tablas.
AWS Glue ETL Admite la lectura/escritura en tablas con permisos a nivel de tabla. Admite la lectura/escritura en tablas con permisos a nivel de tabla. Admite la lectura/escritura en tablas con permisos a nivel de tabla. Admite la lectura/escritura en tablas con permisos a nivel de tabla.