Utilisation de l'utilitaire de chargement de données Aurora Postgre SQL Limitless Database - Amazon Aurora

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de l'utilitaire de chargement de données Aurora Postgre SQL Limitless Database

Aurora fournit un utilitaire permettant de charger des données directement dans Limitless Database à partir d'un cluster de base de données Aurora Postgre ou d'une SQL instance de base RDS de données PostgreSQL.

Pour utiliser l'utilitaire de chargement de données, vous devez suivre les étapes suivantes :

Limites

L'utilitaire de chargement de données présente les limites suivantes :

  • Les types de données suivants ne sont pas pris en charge : enum ARRAY BOXCIRCLE,LINE,LSEG,PATH,PG_LSN,,PG_SNAPSHOT,POLYGON,TSQUERY,TSVECTOR, etTXID_SNAPSHOT.

  • Les zéros en tête (0) sont supprimés du type de VARBIT données lors du chargement.

  • La migration des données échoue lorsqu'il existe des clés primaires composites sur les tables sources.

  • La migration des données échoue lorsque des clés étrangères se trouvent dans les tables de destination.

  • Le chargement de données RDS depuis des clusters de bases de données Postgre SQL Multi-AZ n'est pas pris en charge.

Prérequis

L'utilitaire de chargement de données possède les prérequis suivants :

  • La base de données source utilise Aurora Postgre SQL ou RDS Postgre SQL version 11.x ou ultérieure.

  • La base de données source se trouve dans le même groupe de partitions de base Compte AWS de données Région AWS que dans le groupe de partitions de base de données de destination.

  • Le cluster de base de données ou l'instance de base de données source est dans l'availableétat.

  • Les tables de la base de données source et de la base de données limitless ont les mêmes noms de tables, noms de colonnes et types de données de colonne.

  • Les tables source et de destination possèdent des clés primaires qui utilisent les mêmes colonnes et les mêmes ordres de colonnes.

  • Vous devez disposer d'un environnement permettant de vous connecter à une base de données illimitée pour exécuter des commandes de chargement de données. Les commandes disponibles sont les suivantes :

    • rds_aurora.limitless_data_load_start

    • rds_aurora.limitless_data_load_cancel

  • Dans CDC :

    • La base de données source et le groupe de partitions de base de données de destination doivent utiliser le même groupe de sous-réseaux, le même groupe de VPC sécurité et le même port de base de données. Ces configurations concernent les connexions réseau à la fois à la base de données source et aux routeurs du groupe de partitions de base de données.

    • Vous devez activer la réplication logique sur la base de données source. L'utilisateur de la base de données source doit disposer de privilèges pour lire la réplication logique.

Utilisation de l'outil d'évaluation de compatibilité Limitless

Vous pouvez utiliser l'outil d'évaluation de compatibilité Limitless pour déterminer rapidement si votre base de données Postgre est compatible avec la SQL base de données Aurora Postgre SQL Limitless. Vous générez un pg_dump fichier de schéma uniquement pour la base de données, puis vous l'exécutez sur l'outil pour évaluer les SQL instructions prises en charge et celles qui ne le sont pas.

Pour plus d'informations, consultez la documentation de l'outil d'évaluation de compatibilité Limitless.

Préparation de la base de données source

Pour accéder à la base de données source pour le chargement des données, vous devez autoriser le trafic réseau entrant à y accéder. Procédez comme suit.

Pour autoriser le trafic réseau vers la base de données source
  1. Connectez-vous à la EC2 console Amazon AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/ec2/.

  2. Accédez à la page Groupes de sécurité.

  3. Choisissez l'ID du groupe de sécurité pour le groupe de sécurité utilisé par le cluster ou l'instance de base de données source.

    Par exemple, son ID de groupe de sécurité estsg-056a84f1712b77926.

  4. Dans l'onglet Règles de trafic entrant :

    1. Choisissez Modifier les règles entrantes.

    2. Ajoutez une nouvelle règle entrante pour le cluster ou l'instance de base de données source :

      • Plage de ports : port de base de données pour la base de données source, généralement 5432

      • ID du groupe de sécurité — sg-056a84f1712b77926 dans cet exemple

      Ajoutez une règle d'entrée pour la base de données source.
  5. Dans l'onglet Règles sortantes :

    1. Choisissez Edit outbound rules (Modifier les règles sortantes).

    2. Ajoutez une nouvelle règle sortante pour le cluster ou l'instance de base de données source :

      • Port de base de données — All traffic (ports inclus0-65535)

      • ID du groupe de sécurité — sg-056a84f1712b77926 dans cet exemple

      Ajoutez une règle de sortie pour la base de données source.
  6. Connectez-vous à la VPC console Amazon AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/vpc/.

  7. Accédez à la ACLs page Réseau.

  8. Ajoutez la ACL configuration réseau par défaut comme indiqué dans Réseau par défaut ACL.

Préparation de la base de données de destination

Suivez les procédures décrites Création de tables de base de données Aurora Postgre SQL Limitless pour créer les tables de destination dans le groupe de partitions de base de données.

Vos tables de destination doivent avoir les mêmes schémas, noms de table et clés primaires que les tables sources.

Création d'identifiants de base de données

Vous devez créer des utilisateurs de base de données dans les bases de données source et de destination, et leur accorder les privilèges nécessaires. Pour plus d'informations, consultez CREATEUSERet consultez GRANTla SQL documentation Postgre.

Création des informations d'identification de la base de données source

La commande de démarrage du chargement est transmise à l'utilisateur de la base de données source. Cet utilisateur doit disposer de privilèges pour effectuer une réplication à partir de la base de données source.

  1. Utilisez l'utilisateur principal de base de données (ou un autre utilisateur ayant le rds_superuser rôle) pour créer un utilisateur de base de données source doté de LOGIN privilèges.

    CREATE USER source_db_username WITH PASSWORD 'source_db_user_password';
  2. Accordez le rds_superuser rôle à l'utilisateur de votre base de données source.

    GRANT rds_superuser to source_db_username;
  3. Si vous utilisez le full_load_and_cdc mode, accordez le rds_replication rôle à l'utilisateur de votre base de données source. Le rôle rds_replication accorde les autorisations permettant de gérer des emplacements logiques et de diffuser les données à l’aide d’emplacements logiques.

    GRANT rds_replication to source_db_username;

Création des informations d'identification de base de données de destination

L'utilisateur de la base de données de destination doit être autorisé à écrire dans les tables de destination du groupe de partitions de base de données.

  1. Utilisez l'utilisateur principal de base de données (ou un autre utilisateur ayant le rds_superuser rôle) pour créer un utilisateur de base de données de destination doté de LOGIN privilèges.

    CREATE USER destination_db_username WITH PASSWORD 'destination_db_user_password';
  2. Accordez le rds_superuser rôle à l'utilisateur de votre base de données de destination.

    GRANT rds_superuser to destination_db_username;