Introducción a las integraciones sin ETL de Amazon RDS con Amazon Redshift - Amazon Relational Database Service

Introducción a las integraciones sin ETL de Amazon RDS con Amazon Redshift

Esta es la documentación previa al lanzamiento de las integraciones sin ETL de Amazon RDS con Amazon Redshift, que se encuentra en la versión preliminar. Tanto la documentación como la característica quedan sujetas a cambios. Se recomienda utilizar esta característica solo en entornos de prueba y no en entornos de producción. Para conocer los términos y condiciones de las versiones preliminares, consulte Betas y versiones preliminares en Términos de servicio de AWS.

Antes de crear una integración sin ETL con Amazon Redshift, configure su base de datos de RDS y el almacenamiento de datos de Amazon Redshift con los parámetros y permisos necesarios. Durante la configuración, realizará los siguientes pasos:

Una vez que haya completado estos pasos, continúe con la Creación de integraciones sin ETL de Amazon RDS con Amazon Redshift.

Crear un grupo de parámetros de de base de datos personalizado

Las integraciones sin ETL de Amazon RDS con Amazon Redshift requieren valores específicos para los parámetros de base de datos que controlan el registro binario (binlog). Para configurar el registro binario, primero debe crear un grupo de parámetros personalizado de base de datos y, a continuación, asociarlo a la base de datos de origen.

Cree un grupo de parámetros de de base de datos personalizado con los siguientes ajustes. Para obtener instrucciones sobre cómo crear un grupo de parámetros, consulte Trabajo con los grupos de parámetros en una instancia de base de datos.

  • binlog_format=ROW

  • binlog_row_image=full

  • binlog_checksum=NONE

Compruebe también que el parámetro binlog_row_value_options no esté establecido en PARTIAL_JSON.

Paso 2: seleccionar o crear una base de datos de origen

Tras crear un grupo de parámetros personalizado del de base de datos, elija o cree una instancia de base de datos de RDS para MySQL multi-AZ o single-AZ. Esta base de datos será el origen de la réplica de datos en Amazon Redshift.

La base de datos debe ejecutar RDS para MySQL versión 8.0.32 o posterior. Para obtener instrucciones sobre cómo crear una instancia de base de datos multi-AZ o single-AZ, consulte Creación de una instancia de base de datos de Amazon RDS.

En Configuración adicional, cambie el Grupo de parámetros de base de datos por el grupo de parámetros personalizado que creó en el paso anterior.

nota

si asocia el grupo de parámetros a la base de datos después de haber creado la base de datos, debe reiniciar la base de datos a fin de aplicar los cambios antes de poder crear una integración sin ETL. Para obtener instrucciones, consulte Reinicio de una instancia de base de datos.

Además, asegúrese de que las copias de seguridad automáticas están activadas en la base de datos. Para obtener más información, consulte Habilitar las copias de seguridad automatizadas.

Paso 3: Creación de un almacén de datos de destino en Amazon Redshift

Tras crear la base de datos de origen, debe crear y configurar un almacenamiento de datos de destino en Amazon Redshift. El almacenamiento de datos debe cumplir los siguientes requisitos:

  • Creado en vista previa

    • Para crear un clúster aprovisionado en versión preliminar, seleccione Crear clúster de vista previa en el encabezado del panel de clústeres aprovisionados. Para obtener más información, consulte Creación de un clúster de previsualización..

      Al crear el clúster, configure la pista Vista previa en preview_2023.

    • Para crear un grupo de trabajo Redshift sin servidor en versión preliminar, seleccione Crear grupo de trabajo de vista previa en el encabezado del panel de control sin servidor.. Para obtener más información, consulte Crear un grupo de trabajo de vista previa.

  • Uso de un tipo de nodo RA3 (ra3.xlplus, ra3.4xlarge o ra3.16xlarge) con al menos dos nodos o Redshift sin servidor.

  • Cifrado (si se utiliza un clúster aprovisionado). Para obtener más información, consulte Cifrado de base de datos de Amazon Redshift.

Para obtener instrucciones sobre cómo crear un almacenamiento de datos, consulte la sección Creación de un clúster para clústeres aprovisionados o Creación de un grupo de trabajo con un espacio de nombres para Redshift Serverless.

Activar la distinción entre mayúsculas y minúsculas en el almacén de datos

Para que la integración funcione, el parámetro de distinción entre mayúsculas y minúsculas (enable_case_sensitive_identifier) debe estar habilitado en el almacenamiento de datos. De forma predeterminada, la distinción entre mayúsculas y minúsculas está desactivada en todos los clústeres y grupos de trabajo sin servidor de Redshift suministrados.

Para activar la distinción entre mayúsculas y minúsculas, realice los siguientes pasos en función del tipo de almacén de datos:

  • Clúster aprovisionado: para habilitar la distinción entre mayúsculas y minúsculas en un clúster aprovisionado, cree un grupo de parámetros personalizado con el parámetro enable_case_sensitive_identifier habilitado. A continuación, asocie el grupo de parámetros al cluster. Para obtener instrucciones, consulte la sección Administración de grupos de parámetros mediante la consola o Configuración de los valores de parámetros mediante la AWS CLI.

    nota

    Recuerde reiniciar el clúster después de asociarlo el grupo de parámetros personalizado.

  • Grupo de trabajo sin servidor: para habilitar la distinción entre mayúsculas y minúsculas en un grupo de trabajo sin servidor de Redshift, debe usar AWS CLI. Actualmente, la consola de Amazon Redshift no permite modificar los valores de los parámetros de Redshift sin servidor. Envíe la siguiente solicitud de update-workgroup:

    aws redshift-serverless update-workgroup \ --workgroup-name target-workgroup \ --config-parameters parameterKey=enable_case_sensitive_identifier,parameterValue=true

    No es necesario reiniciar un grupo de trabajo después de modificar los valores de los parámetros.

Configure la autorización para el almacenamiento de datos

Tras crear un almacenamiento de datos, debe configurar la base de datos de RDS de origen como origen de integración autorizado. Para obtener instrucciones, consulte Configuración de la autorización para el almacenamiento de datos de Amazon Redshift.

Siguientes pasos

Ahora que tiene una base de datos de RDS de origen y un almacenamiento de datos de destino de Amazon Redshift, puede crear una integración sin ETL y empezar a replicar los datos. Para obtener instrucciones, consulte Creación de integraciones sin ETL de Amazon RDS con Amazon Redshift.