Migration vers Amazon DocumentDB - Amazon DocumentDB

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Migration vers Amazon DocumentDB

Amazon DocumentDB (compatible avec MongoDB) est un service de base de données entièrement géré compatible avec MongoDB. API Vous pouvez migrer vos données vers Amazon DocumentDB à partir de bases de données MongoDB exécutées sur site ou sur Amazon Elastic Compute Cloud (AmazonEC2) en suivant le processus détaillé dans cette section.

Outils de migration

Pour migrer vers Amazon DocumentDB, les deux principaux outils utilisés par la plupart des clients sont the AWS Database Migration Service (AWS DMS) et les utilitaires de ligne de commande tels que mongodump et. mongorestore En tant que bonne pratique, et pour l'une ou l'autre de ces options, nous vous recommandons de créer d'abord des index dans Amazon DocumentDB avant de commencer votre migration, car cela peut réduire le temps global et accélérer la migration. Pour ce faire, vous pouvez utiliser l'outil d'indexation Amazon DocumentDB.

AWS Database Migration Service

AWS Database Migration Service (AWS DMS) est un service cloud qui facilite la migration de bases de données relationnelles et non relationnelles vers Amazon DocumentDB. Vous pouvez l'utiliser AWS DMS pour migrer vos données vers Amazon DocumentDB à partir de bases de données hébergées sur site ou sur. EC2 Vous pouvez ainsi effectuer des migrations ponctuelles ou répliquer les modifications en cours pour synchroniser les sources et les cibles. AWS DMS

Pour plus d'informations sur l'utilisation AWS DMS de la migration vers Amazon DocumentDB, consultez :

utilitaires de ligne de commande

Les utilitaires courants pour la migration de données vers et depuis Amazon DocumentDB mongodump incluentmongorestore,mongoexport, et. mongoimport Généralement, mongodump et mongorestore sont les utilitaires les plus efficaces car ils vident et restaurent les données de vos bases de données dans un format binaire. Il s'agit généralement de la meilleure option et permet de réduire la taille des données par rapport aux exportations logiques. mongoexportet mongoimport sont utiles si vous souhaitez exporter et importer des données dans un format logique tel CSV que JSON ou tel que les données sont lisibles par l'homme, mais sont généralement plus lentes que lemongodump/mongorestoreet produisent une taille de données plus importante.

La Approches de migration section ci-dessous explique quand il est préférable d'utiliser AWS DMS les utilitaires de ligne de commande en fonction de votre cas d'utilisation et de vos besoins.

Découverte

Pour chacune de vos déploiements MongoDB, vous devez identifier et enregistrer deux jeux de données : Détails d'architecture et Caractéristiques d'exploitation. Ces informations vous permettront de choisir l'approche de migration appropriée et le dimensionnement du cluster.

Détails d'architecture
  • Nom

    Choisissez un nom unique pour le suivi de ce déploiement.

     

  • Version

    Enregistrez la version de MongoDB que votre déploiement exécute. Pour rechercher la version, connectez-vous à un membre du jeu de réplicas avec le shell Mongo et exécutez l'opération db.version().

     

  • Type

    Enregistrez si votre déploiement est une instance mongo autonome, un jeu de réplicas ou un cluster partitionné.

     

  • Membres

    Enregistrez les noms d'hôte, les adresses, et les ports de chaque cluster, jeu de réplicas ou membre autonome.

     

    Pour un déploiement en cluster, vous pouvez trouver les membres de partition mongo en vous connectant à un hôte avec le shell Mongo et en exécutant l'opération sh.status().

     

    Pour un jeu de réplicas, vous pouvez obtenir les membres en vous connectant à un membre de l'ensemble de réplicas avec le shell Mongo et en exécutant l'opération rs.status().

     

  • Tailles oplog

    Pour les jeux de réplicas ou les clusters partitionnés, enregistrez la taille de l'oplog pour chaque membre de l'ensemble de réplicas. Pour rechercher la taille oplog d'un membre, connectez-vous à un membre de l'ensemble de réplicas avec le shell mongo et exécutez l'opération ps.printReplicationInfo().

     

  • Priorités des membres de l'ensemble de réplicas

    Pour les jeux de réplicas ou les clusters partitionnés, enregistrez la priorité de chaque membre du jeu de réplicas. Pour rechercher les priorités des membres du jeu de réplicas, connectez-vous à un membre du jeu de réplicas avec le shell Mongo et exécutez l'opération rs.conf(). La priorité est affichée en tant que valeur de la clé priority.

     

  • TLS/SSLutilisation

    Enregistrez si Transport Layer Security (TLS) /Secure Sockets Layer (SSL) est utilisé sur chaque nœud pour le chiffrement en transit.

Caractéristiques d'exploitation
  • Statistiques de base de données

    Pour chaque collection, enregistrez les informations suivantes :

    • Nom

    • La taille des données

    • Nombre de collections

     

    Pour rechercher les statistiques de la base de données, connectez-vous à cette dernière avec le shell Mongo et exécutez la commande db.runCommand({dbstats: 1}).

     

  • Statistiques de collection

    Pour chaque collection, enregistrez les informations suivantes :

    • Espace de noms

    • La taille des données

    • Nombre d'index

    • Si la collection est limitée

     

  • Statistiques d'index

    Pour chaque collection, enregistrez les informations d'index suivantes :

    • Espace de noms

    • ID

    • Size

    • Clés

    • TTL

    • Fragmentée

    • Contexte

     

    Pour rechercher les informations d'index, connectez-vous à la base de données avec le shell Mongo et exécutez la commande db.collection.getIndexes().

     

  • Compteurs d'opérations

    Ces informations vous permettent de comprendre vos modèles de charge de travail MongoDB actuels (beaucoup de lectures, beaucoup d'écritures ou équilibre). Il fournit également des conseils sur votre sélection initiale d'instance Amazon DocumentDB.

     

    Voici les informations à collecter au cours de la période de surveillance (en nombre/sec) :

    • Requêtes

    • Insertions

    • Mises à jour

    • Suppressions

     

    Vous pouvez obtenir ces informations en représentant dans un graphique le résultat de la commande db.serverStatus() au fil du temps. Vous pouvez également utiliser l'outil mongostat pour obtenir des valeurs instantanées pour ces statistiques. Toutefois, avec cette option, vous risquez de planifier votre migration sur des périodes d'utilisation autres que vos pics de charge.

     

  • Statistiques réseau

    Ces informations vous permettent de comprendre vos modèles de charge de travail MongoDB actuels (beaucoup de lectures, beaucoup d'écritures ou équilibre). Il fournit également des conseils sur votre sélection initiale d'instance Amazon DocumentDB.

     

    Voici les informations à collecter au cours de la période de surveillance (en nombre/sec) :

    • Connexions

    • Octets réseau entrants

    • Octets réseau sortants

     

    Vous pouvez obtenir ces informations en représentant dans un graphique le résultat de la commande db.serverStatus() au fil du temps. Vous pouvez également utiliser l'outil mongostat pour obtenir des valeurs instantanées pour ces statistiques. Toutefois, avec cette option, vous risquez de planifier votre migration sur des périodes d'utilisation autres que vos pics de charge.

Planification : exigences du cluster Amazon DocumentDB

Une migration réussie nécessite que vous examiniez attentivement à la fois la configuration de votre cluster Amazon DocumentDB et la manière dont les applications accèderont à votre cluster. Réfléchissez à chacune des dimensions suivantes pour déterminer les exigences de votre cluster :

  • Disponibilité

    Amazon DocumentDB fournit une haute disponibilité grâce au déploiement d'instances de réplication, qui peuvent être promues au rang d'instance principale dans le cadre d'un processus appelé failover. En déployant des instances de réplica dans différentes zones de disponibilité, vous pouvez atteindre des niveaux de disponibilité plus élevés.

     

    Le tableau suivant fournit des directives relatives aux configurations de déploiement d'Amazon DocumentDB afin de répondre à des objectifs de disponibilité spécifiques.

     

    Objectif de disponibilité Total des instances Réplicas Zones de disponibilité
    99 % 1 0 1
    99,9 % 2 1 2
    99,99 % 3 2 3

     

    La fiabilité globale du système doit prendre en compte tous les composants, pas seulement la base de données. Pour connaître les meilleures pratiques et les recommandations visant à répondre aux besoins globaux de fiabilité du système, consultez le livre blanc AWS Well-Architected Reliability Pillar.

     

  • Performances

    Les instances Amazon DocumentDB vous permettent de lire et d'écrire sur le volume de stockage de votre cluster. Les instances de cluster sont de plusieurs types, avec des quantités de mémoire et de v variablesCPU, ce qui affecte les performances de lecture et d'écriture de votre cluster. À l'aide des informations que vous avez collectées lors de la phase de détection, choisissez un type d'instance capable de prendre en charge vos exigences de performances pour la charge de travail. Pour obtenir la liste des types d’instances, consultez Gestion des classes d'instances.

     

    Lorsque vous choisissez un type d'instance pour votre cluster Amazon DocumentDB, tenez compte des aspects suivants des exigences de performance de votre charge de travail :

    • vCPUs—Les architectures qui nécessitent un nombre de connexions plus élevé peuvent bénéficier d'instances avec plus de v. CPUS

       

    • Mémoire : lorsque cela est possible, le fait de conserver votre ensemble de données de travail en mémoire garantit des performances optimales. Une règle de départ consiste à réserver un tiers de la mémoire de votre instance pour le moteur Amazon DocumentDB, en laissant les deux tiers pour votre ensemble de données de travail.

       

    • Connexions — Le nombre de connexions optimal minimum est de huit connexions par instance Amazon DocumentDB v. CPU Bien que la limite de connexion aux instances Amazon DocumentDB soit beaucoup plus élevée, les avantages en termes de performances liés aux connexions supplémentaires diminuent au-delà de huit connexions par v. CPU

       

    • Réseau : les charges de travail comportant un grand nombre de clients ou de connexions doivent tenir compte des performances réseau agrégées requises pour les données insérées et extraites. Les opérations en bloc peuvent utiliser plus efficacement les ressources réseau.

       

    • Performances d'insertion : les insertions de documents uniques constituent généralement le moyen le plus lent d'insérer des données dans Amazon DocumentDB. Les opérations d'insertion en bloc peuvent être nettement plus rapides que les insertions uniques.

       

    • Performances de lecture : les lectures depuis la mémoire de travail sont toujours plus rapides que les lectures renvoyées depuis le volume de stockage. Par conséquent, l'optimisation de la taille de la mémoire d'instance afin de conserver votre jeu de travail en mémoire est idéale.

       

    En plus de servir les lectures depuis votre instance principale, les clusters Amazon DocumentDB sont automatiquement configurés en tant que jeux de répliques. Vous pouvez alors acheminer les requêtes en lecture seule vers les réplicas en lecture en définissant la préférence de lecture dans votre pilote MongoDB. Vous pouvez dimensionner le trafic en lecture en ajoutant des réplicas, ce qui réduit la charge globale sur l'instance principale.

     

    Il est possible de déployer des répliques Amazon DocumentDB de différents types d'instances dans le même cluster. Un exemple de cas d'utilisation peut être le maintien d'un réplica avec un type d'instance plus important pour servir le trafic d'analyses temporaire. Si vous déployez un ensemble de types d'instance varié, assurez-vous de configurer la priorité de basculement pour chaque instance. Vous vous assurerez ainsi qu'un événement de basculement promeut toujours un réplica d'une taille suffisante pour gérer votre charge d'écriture.

     

  • Récupération

    Amazon DocumentDB sauvegarde en permanence vos données au fur et à mesure qu'elles sont écrites. Il fournit des fonctionnalités de point-in-time restauration (PITR) sur une période configurable de 1 à 35 jours, connue sous le nom de période de conservation des sauvegardes. La durée de conservation des sauvegardes par défaut est d'un jour. Amazon DocumentDB crée également automatiquement des instantanés quotidiens de votre volume de stockage, qui sont également conservés pendant la période de conservation des sauvegardes configurée.

     

    Si vous souhaitez conserver les instantanés au-delà de la période de conservation des sauvegardes, vous pouvez également lancer des instantanés manuels à tout moment à l'aide du bouton AWS Management Console et AWS Command Line Interface ()AWS CLI. Pour de plus amples informations, veuillez consulter Sauvegarde et restauration dans Amazon DocumentDB.

     

    Tenez compte des éléments suivants lorsque vous planifiez votre migration :

    • Choisissez une période de conservation des sauvegardes de 1 à 35 jours qui répond à votre objectif de point de restauration (RPO).

    • Déterminez si vous avez besoin que les instantanés soient créés manuellement et, le cas échéant, à quel intervalle.

Approches de migration

Il existe trois approches principales pour migrer vos données vers Amazon DocumentDB.

Note

Bien que vous puissiez créer des index à tout moment dans Amazon DocumentDB, il est globalement plus rapide de créer vos index avant d'importer des ensembles de données volumineux. À titre de bonne pratique, nous vous recommandons, pour chacune des approches ci-dessous, de créer d'abord vos index dans Amazon DocumentDB avant d'effectuer la migration. Pour ce faire, vous pouvez utiliser l'outil d'indexation Amazon DocumentDB.

Hors connexion

L'approche hors ligne utilise les mongorestore outils mongodump et pour migrer vos données de votre déploiement MongoDB source vers votre cluster Amazon DocumentDB. La méthode hors ligne est l'approche de migration la plus simple, mais elle entraîne aussi le plus de temps d'arrêt pour votre cluster.

Le processus de base pour la migration hors ligne se présente comme suit :

  1. Arrêtez les écritures sur votre source MongoDB.

  2. Videz les index et les ensembles de données du déploiement MongoDB source.

  3. Si vous migrez vers un cluster élastique, créez vos collections partitionnées à l'aide de la sh.shardCollection() commande. Si vous migrez vers un cluster basé sur une instance, passez à l'étape suivante.

  4. Restaurez les index dans le cluster Amazon DocumentDB.

  5. Restaurez les données de collecte sur le cluster Amazon DocumentDB.

  6. Modifiez le point de terminaison de votre application pour écrire dans le cluster Amazon DocumentDB.

Schéma : approche hors ligne de la migration vers Amazon DocumentDB

En ligne

L'approche en ligne utilise AWS Database Migration Service (AWS DMS). Il effectue un chargement complet des données de votre déploiement MongoDB source vers votre cluster Amazon DocumentDB. Il passe ensuite en mode change de capture de données (CDC) pour répliquer les modifications. L'approche en ligne limite les temps d'arrêt pour votre cluster, mais cette méthode est la plus lente des trois.

Le processus de base pour la migration en ligne se présente comme suit :

  1. Votre application utilise la base de données source normalement.

  2. Si vous migrez vers un cluster élastique, créez vos collections partitionnées à l'aide de la sh.shardCollection() commande. Si vous migrez vers un cluster basé sur une instance, passez à l'étape suivante.

  3. Créez au préalable des index dans le cluster Amazon DocumentDB.

  4. Créez une AWS DMS tâche pour effectuer un chargement complet, puis activez-la CDC depuis le déploiement source de MongoDB vers le cluster Amazon DocumentDB.

  5. Une fois le chargement complet de la AWS DMS tâche terminé et la réplication des modifications apportées à Amazon DocumentDB, basculez le point de terminaison de l'application vers le cluster Amazon DocumentDB.

Schéma : approche en ligne pour la migration vers Amazon DocumentDB

Pour plus d'informations sur l'utilisation AWS DMS pour migrer, consultez la section Utilisation d'Amazon DocumentDB comme cible pour AWS Database Migration Service et le didacticiel associé dans le guide de l'AWS Database Migration Service utilisateur.

Hybride

L'approche hybride utilise les mongorestore outils mongodump et pour migrer vos données de votre déploiement MongoDB source vers votre cluster Amazon DocumentDB. Il utilise ensuite AWS DMS le CDC mode in pour répliquer les modifications. L'approche hybride équilibre la vitesse de migration et les temps d'arrêt, mais constitue l'approche la plus complexe des trois.

Le processus de base pour la migration hybride se présente comme suit :

  1. Votre application utilise le déploiement MongoDB source normalement.

  2. Videz les index et les ensembles de données du déploiement MongoDB source.

  3. Restaurez les index dans le cluster Amazon DocumentDB.

  4. Si vous migrez vers un cluster élastique, créez vos collections partitionnées à l'aide de la sh.shardCollection() commande. Si vous migrez vers un cluster basé sur une instance, passez à l'étape suivante.

  5. Restaurez les données de collecte sur le cluster Amazon DocumentDB.

  6. Créez une AWS DMS tâche à activer CDC depuis le déploiement source de MongoDB vers le cluster Amazon DocumentDB.

  7. Lorsque la AWS DMS tâche réplique les modifications dans une fenêtre acceptable, modifiez le point de terminaison de votre application pour écrire dans le cluster Amazon DocumentDB.

Schéma : approche hybride de la migration vers Amazon DocumentDB
Important

Une AWS DMS tâche ne peut actuellement migrer qu'une seule base de données. Si votre source MongoDB comporte un grand nombre de bases de données, vous devrez peut-être automatiser la création des tâches de migration ou envisager d'utiliser la méthode hors connexion.

Quelle que soit l'approche de migration que vous choisissez, il est plus efficace de pré-créer des index dans votre cluster Amazon DocumentDB avant de migrer vos données. Cela est dû au fait que les index Amazon DocumentDB sont des données insérées en parallèle, mais la création d'un index sur des données existantes est une opération monothread.

Comme il AWS DMS ne migre pas les index (uniquement vos données), aucune étape supplémentaire n'est requise pour éviter de créer des index une deuxième fois.

Sources de migration

Si votre source MongoDB est un processus mongo autonome et que vous souhaitez utiliser les approches de migration en ligne ou hybrides, convertissez d'abord votre mongo autonome en un jeu de répliques afin que le journal oplog soit créé pour être utilisé comme source. CDC

Si vous migrez à partir d'un cluster partitionné ou de jeux de réplicas MongoDB, envisagez de créer un secondaire enchainé ou masqué pour chaque jeu de réplicas ou partition à utiliser comme source de migration. L'exécution des vidages des données peut forcer l'utilisation des jeux de données hors de la mémoire et avoir un impact sur les performances des instances de production. Vous pouvez réduire ce risque en migrant à partir d'un nœud qui ne sert pas des données de production.

Versions des sources de migration

Si la version de votre base de données MongoDB source est différente de la version de compatibilité de votre cluster Amazon DocumentDB de destination, vous devrez peut-être prendre d'autres mesures de préparation pour garantir une migration réussie. Les deux exigences les plus courantes sont la nécessité de mettre à niveau l'installation source de MongoDB vers une version prise en charge pour la migration (MongoDB version 3.0 ou supérieure) et la mise à niveau des pilotes de votre application pour prendre en charge la version cible d'Amazon DocumentDB.

Si votre migration possède l'une ou l'autre de ces exigences, veillez à intégrer ces étapes de votre plan de migration pour mettre à niveau et tester toutes les modifications du pilote.

Connectivité de migration

Vous pouvez migrer vers Amazon DocumentDB depuis un déploiement MongoDB source exécuté dans votre centre de données ou depuis un déploiement MongoDB exécuté sur une instance Amazon. EC2 La migration depuis MongoDB en cours d'exécution EC2 est simple et nécessite uniquement de configurer correctement vos groupes de sécurité et vos sous-réseaux.

Schéma : migration vers Amazon DocumentDB depuis une source Amazon EC2

La migration depuis une base de données sur site nécessite une connectivité entre votre déploiement MongoDB et votre cloud privé virtuel (). VPC Vous pouvez y parvenir par le biais d'une connexion réseau privé virtuel (VPN) ou en utilisant le AWS Direct Connect service. Bien que vous puissiez migrer via Internet vers votreVPC, cette méthode de connexion est la moins souhaitable du point de vue de la sécurité.

Le schéma suivant illustre une migration vers Amazon DocumentDB depuis une source locale via une connexion. VPN

Schéma : migration vers Amazon DocumentDB à partir d'une source locale () VPN

Ce qui suit représente une migration vers Amazon DocumentDB à partir d'une source locale à l'aide de. AWS Direct Connect

Schéma : migration vers Amazon DocumentDB à partir d'une source locale ()AWS Direct Connect

Les approches de migration en ligne et hybrides nécessitent l'utilisation d'une AWS DMS instance, qui doit s'exécuter sur Amazon EC2 dans un AmazonVPC. Toutes les approches nécessitent que le serveur de migration exécute mongodump et mongorestore. Il est généralement plus facile d'exécuter le serveur de migration sur une EC2 instance Amazon VPC où votre cluster Amazon DocumentDB est lancé, car cela simplifie considérablement la connectivité à votre cluster Amazon DocumentDB.

Test

Voici des objectifs de test prémigration :

  • Vérifiez que l'approche choisie donne le résultat de migration souhaité.

  • Vérifiez que vos choix de type d'instance et préférences de lecture respectent les exigences en matière de performances de votre application.

  • Vérifiez le comportement de votre application lors du basculement.

Considérations relatives aux tests du plan de migration

Tenez compte des points suivants lorsque vous testez votre plan de migration Amazon DocumentDB.

Restauration des index

Par défaut, mongorestore crée des index pour les collections vidées, mais il les crée une fois que les données ont été restaurées. Dans l'ensemble, il est plus rapide de créer des index dans Amazon DocumentDB avant que les données ne soient restaurées dans le cluster. En effet, les opérations d'indexation sont mises en parallèle pendant le chargement des données.

Si vous choisissez de précréer vos index, vous pouvez ignorer l'étape de création d'index lors de la restauration des données avec mongorestore en fournissant l'option -–noIndexRestore.

Données de dumping

L'outil mongodump est la méthode préférée de vidage des données à partir de votre déploiement MongoDB source. Selon les ressources disponibles sur votre instance de migration, vous pouvez être en mesure d'accélérer votre mongodump en augmentant le nombre de connexions parallèles vidées à partir de la valeur par défaut 4 à l'aide de l'option –-numParallelCollections.

Restauration des données

mongorestoreCet outil est la méthode préférée pour restaurer les données transférées sur votre instance Amazon DocumentDB. Vous pouvez améliorer les performances de restauration en augmentant le nombre d'agents de travail pour chaque collection pendant la restauration avec l'option -–numInsertionWorkersPerCollection. Un travailleur par v CPU sur votre instance principale de cluster Amazon DocumentDB est un bon point de départ.

Amazon DocumentDB ne prend actuellement pas en charge l'option de l'mongorestore--oplogReplayoutil.

Par défaut, mongorestore ignore les erreurs d'insertion et continue le processus de restauration. Cela peut se produire si vous restaurez des données non prises en charge sur votre instance Amazon DocumentDB. Par exemple, cela peut se produire si vous avez un document qui contient des valeurs ou clés avec des chaînes null. Si vous préférez que l'opération mongorestore échoue totalement si une erreur de restauration se produit, utilisez l'option --stopOnError.

Dimensionnement de l'oplog

Le journal des opérations MongoDB (oplog) est une collection limitée qui contient toutes les modifications apportées à votre base de données. Vous pouvez afficher la taille de l'oplog et la plage de temps qu'il contient en exécutant l'opération db.printReplicationInfo() sur un jeu de réplicas ou un membre de partition.

Si vous utilisez des approches en ligne ou hybrides, assurez-vous que le journal journal de chaque jeu de répliques ou de chaque partition est suffisamment grand pour contenir toutes les modifications apportées pendant toute la durée du processus de migration des données (que ce soit par le biais du chargement complet d'une tâche mongodump ou d'une AWS DMS tâche), ainsi qu'une mémoire tampon raisonnable. Pour de plus amples informations, veuillez consulter Vérification de la taille du Oplog dans la documentation MongoDB. Déterminez la taille oplog minimale requise en enregistrant le temps écoulé pour la première série de tests de votre processus mongodump ou mongorestore, ou de la tâche de chargement complet AWS DMS .

AWS Database Migration Service configuration

Le guide de AWS Database Migration Service l'utilisateur décrit les composants et les étapes nécessaires à la migration de vos données sources MongoDB vers votre cluster Amazon DocumentDB. Voici le processus de base AWS DMS à utiliser pour effectuer une migration en ligne ou hybride :

Pour effectuer une migration à l'aide de AWS DMS
  1. Créez un point de terminaison source MongoDB. Pour plus d'informations, consultez Utilisation de MongoDB comme source pour AWS DMS.

  2. Créez un point de terminaison cible Amazon DocumentDB. Pour plus d'informations, consultez Utilisation des points de terminaison AWS DMS.

    Si vous configurez votre point de terminaison cible en tant que cluster élastique, notez que votre SSL certificat Amazon DocumentDB existant ne fonctionnera pas avec les clusters élastiques et que vous devrez attacher un nouveau SSL certificat à votre point de terminaison en suivant les étapes suivantes :

    a. Accédez au https://www.amazontrust.com/repository/SFSRootCAG2fichier .pem et enregistrez le contenu dans un SFSRootCAG2 fichier « .pem ». Il s'agit du fichier de certificat que vous devrez importer lors des étapes suivantes.

    b. Lors de la création du point de terminaison du cluster élastique, sous Configuration du point de terminaison, choisissez Ajouter un nouveau certificat CA.

    • Pour Identifiant de certificat, entrez SFSRootCAG2.pem.

    • Dans Import certificate file (Importer un fichier de certificat), choisissez Choose file (Choisir un fichier) et accédez au fichier SFSRootCAG2.pem que vous avez téléchargé précédemment. Sélectionnez et ouvrez le fichier. Choisissez Importer un certificat, puis SFSRootCAG2.pem choisissez dans le menu déroulant Choisir un certificat.

  3. Créez au moins une instance AWS DMS de réplication. Pour plus d'informations, consultez la section Utilisation d'une instance de AWS DMS réplication.

  4. Créez au moins une tâche AWS DMS de réplication. Pour plus d'informations, consultez Utilisation des tâches AWS DMS.

    Pour une migration en ligne, votre tâche de migration utilise le type de migration Migration des données existantes et réplication des modifications continues.

    Pour une migration hybride, votre tâche de migration utilise le type de migration Replicate data changes only (Répliquer les changements de données uniquement). Vous pouvez choisir l'heure de CDC début en fonction de l'heure de vidage de votre mongodump opération. L'oplog MongoDB est idempotent. Pour éviter de rater des modifications, il est conseillé de laisser un intervalle de quelques minutes entre votre heure de mongodump fin et votre heure de CDC début.

Migration depuis un cluster fragmenté

Le processus de migration des données d'un cluster fragmenté MongoDB vers votre instance Amazon DocumentDB est essentiellement celui de plusieurs migrations de répliques en parallèle. Dans le cadre du test de la migration d'un cluster partitionné, il est essentiel de tenir compte du fait que certaines partitions peuvent être plus largement utilisées que d'autres. Cette situation entraîne différents délais pour la migration de données. Assurez-vous d'évaluer les oplog exigences de chaque partition lors de la planification et des tests.

Voici quelques problèmes de configuration à prendre en compte lors de la migration d'un cluster partitionné :

  • Avant d'exécuter mongodump ou de démarrer une tâche de migration AWS DMS , vous devez désactiver l'équilibreur de cluster partitionné et attendre la fin de toutes les migrations en cours. Pour de plus amples informations, veuillez consulter Désactiver l'équilibreur dans la documentation MongoDB.

  • Si vous utilisez AWS DMS pour répliquer des données, exécutez la cleanupOrphaned commande sur chaque partition avant d'exécuter les tâches de migration. Si vous n'exécutez pas cette commande, les tâches risquent d'échouer en raison d'un document dupliquéIDs. Notez que cette commande peut avoir un impact sur les performances. Pour plus d'informations, consultez cleanupOrphanedla documentation de MongoDB.

  • Si vous utilisez l'outil mongodump pour vider les données, vous devez exécuter un processus mongodump par partition. L'approche la plus efficace en terme de durée peut nécessiter plusieurs serveurs de migration pour optimiser vos performances de vidage.

  • Si vous utilisez AWS Database Migration Service pour répliquer des données, vous devez créer un point de terminaison source pour chaque partition. Exécutez également au moins une tâche de migration pour chaque partition que vous migrez. L'approche la plus efficace en terme de durée peut nécessiter plusieurs instances de réplication pour optimiser vos performances de migration.

Tests de performance

Après avoir migré avec succès vos données vers votre cluster Amazon DocumentDB de test, exécutez votre charge de travail de test sur le cluster. Vérifiez à l'aide CloudWatch des métriques Amazon que vos performances atteignent ou dépassent le débit actuel de votre déploiement de source MongoDB.

Vérifiez les indicateurs clés d'Amazon DocumentDB suivants :

  • Débit réseau

  • Write throughput

  • Read throughput

  • Replica lag

Pour de plus amples informations, veuillez consulter Surveillance d'Amazon DocumentDB.

Test de basculement

Vérifiez que le comportement de votre application lors d'un événement de basculement d'Amazon DocumentDB répond à vos exigences de disponibilité. Pour lancer un basculement manuel d'un cluster Amazon DocumentDB sur la console, sur la page Clusters, choisissez l'action Failover dans le menu Actions.

Vous pouvez également lancer un basculement en exécutant l'opération failover-db-cluster depuis l' AWS CLI. Pour plus d'informations, consultez failover-db-clusterla section Amazon DocumentDB de la AWS CLI référence.

Ressources supplémentaires

Consultez les rubriques suivantes dans le Guide de l'utilisateur AWS Database Migration Service  :