Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Uso AWS Lake Formation con Amazon Redshift Spectrum
Con Amazon Redshift Spectrum puede consultar y recuperar datos en lagos de datos de Amazon S3 sin tener que cargar datos en nodos de clústeres de Amazon Redshift.
Redshift Spectrum admite dos formas de registrar un catálogo de AWS Glue datos externo habilitado con Lake Formation.
Uso de un rol de IAM adjunto a un clúster que tenga permiso para el Catálogo de datos
Para crear un rol de IAM, siga los pasos descritos en el siguiente procedimiento.
-
Uso de una identidad de IAM federada configurada para gestionar el acceso a recursos AWS Glue Data Catalog externos
Redshift Spectrum admite la consulta de tablas de Lake Formation mediante identidades de IAM federadas. Las identidades de IAM pueden ser un usuario de IAM o un rol de IAM. Para obtener más información sobre la federación de identidades IAM en Redshift Spectrum, consulte Uso de una identidad federada para administrar el acceso de Amazon Redshift a los recursos locales y a las tablas externas de Redshift Spectrum.
Con la integración de Lake Formation y Redshift Spectrum, puede definir los permisos de control de acceso de fila, columna y celda en las tablas después de registrar sus datos en Lake Formation.
Para obtener más información, consulte Uso de Redshift Spectrum con. AWS Lake Formation
Redshift Spectrum admite lecturas o consultas de SELECT
en las tablas de esquemas externos administradas por Lake Formation.
Para obtener más información, consulte Creación de esquemas externos para Redshift Spectrum.
Compatibilidad con tipos de tablas transaccionales
La tabla siguiente muestra los formatos de tablas transaccionales compatibles con los permisos de Athena y Lake Formation.
Formato de tabla | Descripción y operaciones permitidas | Permisos de Lake Formation compatibles con Redshift Spectrum |
---|---|---|
Apache Hudi |
Formato utilizado para simplificar el procesamiento incremental de datos y el desarrollo de canalizaciones de datos. Redshift Spectrum admite operaciones de inserción, eliminación y escritura alterada mediante el formato de tabla Apache Hudi Copy on Write (CoW) Para obtener más información, consulte Creación de tablas externas para datos administrados en Apache Hudi. |
Utilice Filtrado de datos y seguridad de celda en Lake Formation para proteger las tablas de Hudi mediante permisos de tabla, columna, fila y celda. |
Apache Iceberg |
Iceberg administra grandes colecciones de archivos como tablas y admite operaciones de lago de datos analíticos modernos, como las consultas de inserción, actualización y eliminación de registros, y viajes en el tiempo. Para obtener más información, consulte Uso de tablas de Apache Iceberg con Amazon Redshift. |
Redshift Spectrum admite tablas Apache Iceberg para efectuar consultas. |
Linux Foundation Delta Lake | Delta Lake es un proyecto de código abierto que ayuda a implementar arquitecturas de lago de datos modernos comúnmente construidas sobre Amazon S3 o Sistema de archivos distribuido de Hadoop (HDFS). Redshift Spectrum admite la consulta de tablas Delta Lake. Para obtener más información, consulte Creación de tablas externas para datos administrados en Delta Lake |
Son compatibles los permisos de tabla, columna, fila y celda. |