Configuración de un destino de integración sin ETL - AWS Glue

Configuración de un destino de integración sin ETL

Al configurar un destino de una integración sin ETL, AWS ofrece varias opciones. El destino puede ser un almacenamiento de datos cifrado de Amazon Redshift o un catálogo de Amazon SageMaker Lakehouse.

Antes de seleccionar el destino para la integración sin ETL, debe configurar uno de los siguientes recursos de destino.

Las opciones de configuración de un destino en una integración sin ETL incluyen:

nota

No puede modificar el destino de una integración sin ETL después de su creación.

Configuración de la integración con su destino

Tras seleccionar la conexión y especificar un rol de IAM de origen, siga estos pasos cuando especifique un destino de almacenamiento de datos de Amazon Redshift:

  1. Especifique el espacio de nombres del clúster de Redshift o del grupo de trabajo de Redshift sin servidor, o bien cree un nuevo espacio de nombres.

  2. Seleccione la opción de AWS Glue Solucionarlo por mí. Para el destino de Redshift, esto permitirá lo siguiente:

    • Aplicar una entidad principal autorizada al clúster de Redshift o al grupo de trabajo sin servidor.

    • Aplicar un ARN de origen de Glue autorizado al clúster de Redshift o al grupo de trabajo sin servidor.

    • Asociar un nuevo grupo de parámetros con enable_case_sensitive_identifier = true.

    Esta captura de pantalla muestra la selección de un destino en una integración sin ETL.
  3. Proporcione el nombre de la integración y elija Crear e iniciar la integración.

  4. Una vez que la integración esté activa, vaya a la página de detalles de la integración y seleccione Crear una base de datos a partir de la integración.

  5. Por último, puede ir al editor de consultas de Redshift y conectarse a su base de datos para validar la instantánea y los datos incrementales.

nota

Recuerde que solo puede utilizar caracteres alfanuméricos en minúscula y guiones bajos en el nombre del espacio de nombres o del catálogo. Esto es diferente de lo que permite el catálogo de datos de AWS Glue al crear una base de datos con cualquier nombre (incluidos caracteres especiales).

Siga estos pasos al especificar un catálogo y una base de datos de Amazon SageMaker Lakehouse que se hayan configurado con un destino de almacenamiento de Amazon S3:

  1. Registre una integración de Redshift en el catálogo de Lake Formation. Consulte Registering Amazon Redshift clusters and namespaces to the AWS Glue Data Catalog.

  2. Cree un catálogo federado o gestionado en Lake Formation de AWS. Para obtener más información, consulte: