Bien démarrer avec les intégrations zéro ETL d'Amazon RDS à Amazon Redshift - Amazon Relational Database Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Bien démarrer avec les intégrations zéro ETL d'Amazon RDS à Amazon Redshift

Il s'agit de la documentation préliminaire relative aux intégrations zéro ETL d'Amazon RDS à Amazon Redshift, qui est disponible en version préliminaire. La documentation et la fonction sont toutes deux sujettes à modification. Nous vous recommandons d’utiliser cette fonction uniquement dans des environnements de test et non dans des environnements de production. Pour voir les conditions générales, consultez Beta and Previews (Bêtas et aperçus) dans les Conditions de service AWS.

Avant de créer une intégration zéro ETL avec Amazon Redshift, configurez votre cluster de base de données RDS DB et votre entrepôt de données Amazon Redshift avec les paramètres et autorisations requis. Au cours de la configuration, vous allez suivre les étapes suivantes :

Une fois ces étapes terminées, reportez-vous à Création d'intégrations zéro ETL d'Amazon RDS à Amazon Redshift.

Étape 1 : Créer un groupe de paramètres de base de données personnalisé

Les intégrations Amazon RDS Zero-ETL avec Amazon Redshift nécessitent des valeurs spécifiques pour les paramètres de base de données qui contrôlent la journalisation binaire (binlog). Pour configurer la journalisation binaire, vous devez d'abord créer un groupe de paramètres de base de données personnalisé, puis l'associer à la base de données source.

Créez un groupe de paramètres de de base de données personnalisé avec les paramètres suivants . Pour obtenir des instructions sur la création d'un groupe de paramètres, consultez Utilisation de groupes de paramètres de base de données dans une instance de base de données.

  • binlog_format=ROW

  • binlog_row_image=full

  • binlog_checksum=NONE

Assurez-vous également que le paramètre binlog_row_value_options n'est pas défini sur PARTIAL_JSON.

Étape 2 : sélectionner ou créer un de base de données source

Après avoir créé un groupe de paramètres de de base de données personnalisé, choisissez ou créez une instance de base de données RDS pour MySQL (instance de base de données mono-AZ ou multi-AZ Aurora ). Ce de base de données sera la source de réplication des données vers Amazon Redshift.

Le de bases de données doit exécuter RDS pour MySQL version 8.0.32 ou supérieure, Aurora 15.4 et Zero-ETL Support). Pour obtenir des instructions sur la création d'un . Création d'une instance de base de données Amazon RDS

Sous Configuration supplémentaire, remplacez le groupe de paramètres du de base de données par défaut par le groupe de paramètres personnalisé que vous avez créé à l'étape précédente.

Note

vous associez le groupe de paramètres au de base de données une fois que a déjà été créé, vous devez redémarrer l' pour appliquer les modifications avant de pouvoir créer une intégration zéro ETL. Pour obtenir des instructions, veuillez consulter Redémarrage d'une instance de base de données.

Assurez-vous également que les sauvegardes automatisées sont activées sur la base de données. Pour plus d’informations, consultez Activation des sauvegardes automatiques.

Étape 3 : Créer un entrepôt des données Amazon Redshift cible

Après avoir créé votre de base de données source, vous devez créer et configurer un entrepôt de données cible dans Amazon Redshift. L'entrepôt de données doit respecter les exigences suivantes :

  • Créé en version préliminaire

    • Pour créer un cluster provisionné dans la version préliminaire, choisissez Créer un cluster en version préliminaire dans la bannière du tableau de bord des clusters provisionnés. Pour plus d'informations, consultez Création d'un cluster en version prélimnaire.

      Lors de la création du cluster, définissez l'option Chemin d'accès à la prévisualisation sur preview_2023.

    • Pour créer un groupe de travail Redshift sans serveur en version préliminaire, choisissez Créer un groupe de travail en mode de prévisualisation dans la bannière du tableau de bord sans serveur. Pour plus d'informations, consultez Création d'un groupe de travail de prévisualisation.

  • En utilisant un type de nœud RA3 (ra3.xlplus,ra3.4xlarge, oura3.16xlarge) avec au moins deux nœuds, ou Redshift Serverless.

  • Chiffré (si vous utilisez un cluster provisionné). Pour plus d’informations, consultez Chiffrement de base de données Amazon Redshift.

Pour obtenir des instructions sur la création d'un entrepôt des données, consultez Création d'un cluster pour les clusters provisionnés ou Création d'un groupe de travail avec un espace de noms pour Redshift sans serveur.

Activer la sensibilité à la casse sur l'entrepôt des données

Pour que l'intégration réussisse, le paramètre de sensibilité à la casse (enable_case_sensitive_identifier) doit être activé pour l'entrepôt des données. Par défaut, la sensibilité à la casse est désactivée sur tous les clusters provisionnés et les groupes de travail Redshift sans serveur.

Pour activer la sensibilité à la casse, effectuez les étapes suivantes en fonction du type de votre entrepôt des données :

  • Cluster provisionné : pour activer la sensibilité à la casse sur un cluster provisionné, créez un groupe de paramètres personnalisé en activant le paramètre enable_case_sensitive_identifier. Associez ensuite le groupe de paramètres au cluster. Pour obtenir des instructions, consultez Gestion des groupes de paramètres à l'aide de la console ou Configuration des valeurs des paramètres à l'aide de l' AWS CLI.

    Note

    N'oubliez pas de redémarrer le cluster après lui avoir associé le groupe de paramètres personnalisé.

  • Groupe de travail sans serveur : pour activer la sensibilité à la casse sur un groupe de travail Redshift sans serveur, vous devez utiliser l' AWS CLI. La console Amazon Redshift ne prend actuellement pas en charge la modification des valeurs des paramètres Redshift sans serveur. Envoyez la demande de mise à jour du groupe de travail suivante :

    aws redshift-serverless update-workgroup \ --workgroup-name target-workgroup \ --config-parameters parameterKey=enable_case_sensitive_identifier,parameterValue=true

    Vous n'avez pas besoin de redémarrer un groupe de travail après avoir modifié ses valeurs de paramètres.

Configuration de l'autorisation pour l'entrepôt des données

Après avoir créé un entrepôt de données, vous devez configurer le de la base de données RDS source en tant que source d'intégration autorisée. Pour obtenir des instructions, consultez Configuration de l'autorisation pour votre entrepôt des données Amazon Redshift.

Étapes suivantes

Avec un source et un entrepôt de données cible Amazon Redshift, vous pouvez désormais créer une intégration zéro ETL et répliquer les données. Pour obtenir des instructions, consultez Création d'intégrations zéro ETL d'Amazon RDS à Amazon Redshift.