Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Migrer une base de données ThoughtSpot Falçon sur site vers Amazon Redshift
Créée par Battulga Purevragchaa (AWS) et Antony Prasad Thevaraj (AWS)
Récapitulatif
Les entrepôts de données sur site nécessitent beaucoup de temps et de ressources d'administration, en particulier pour les grands ensembles de données. Le coût financier de la construction, de l'entretien et de la croissance de ces entrepôts est également très élevé. Pour vous aider à gérer les coûts, à réduire la complexité de l'extraction, de la transformation et du chargement (ETL) et à optimiser les performances à mesure que vos données augmentent, vous devez constamment choisir les données à charger et les données à archiver.
En migrant vos bases de données ThoughtSpot Falçon
Ce modèle décrit les étapes et le processus de migration d'une base de données ThoughtSpot Falçon d'un centre de données sur site vers une base de données Amazon Redshift sur le cloud AWS.
Conditions préalables et limitations
Prérequis
Un compte AWS actif
Une base de données ThoughtSpot Falçon hébergée dans un centre de données sur site
Versions du produit
ThoughtSpot version 7.0.1
Architecture

Le schéma suivant illustre le flux de travail suivant :
Les données sont hébergées dans une base de données relationnelle sur site.
AWS Schema Conversion Tool (AWS SCT) convertit le langage de définition de données (DDL) compatible avec Amazon Redshift.
Une fois les tables créées, vous pouvez migrer les données à l'aide d'AWS Database Migration Service (AWS DMS).
Les données sont chargées dans Amazon Redshift.
Les données sont stockées dans Amazon Simple Storage Service (Amazon S3) si vous utilisez Redshift Spectrum ou si vous hébergez déjà les données dans Amazon S3.
Outils
AWS DMS — AWS Data Migration Service (AWS DMS) vous aide à migrer rapidement et en toute sécurité des bases de données vers AWS.
Amazon Redshift — Amazon Redshift est un service d'entrepôt de données rapide, entièrement géré et de plusieurs pétaoctets qui permet d'analyser de manière simple et rentable toutes vos données à l'aide de vos outils de business intelligence existants.
AWS SCT — AWS Schema Conversion Tool (AWS SCT) convertit votre schéma de base de données existant d'un moteur de base de données à un autre.
Épopées
Tâche | Description | Compétences requises |
---|---|---|
Identifiez la configuration Amazon Redshift appropriée. | Identifiez la configuration de cluster Amazon Redshift appropriée en fonction de vos besoins et du volume de données. Pour plus d'informations, consultez les clusters Amazon Redshift dans la documentation Amazon Redshift. | DBA |
Faites des recherches sur Amazon Redshift pour déterminer s'il répond à vos besoins. | Utilisez Amazon Redshift FAQs | DBA |
Tâche | Description | Compétences requises |
---|---|---|
Créez un cluster Amazon Redshift. | Connectez-vous à l'AWS Management Console, ouvrez la console Amazon Redshift, puis créez un cluster Amazon Redshift dans un cloud privé virtuel (VPC). Pour plus d'informations, consultez la section Création d'un cluster dans un VPC dans la documentation Amazon Redshift. | DBA |
Réalisez un PoC pour la conception de votre base de données Amazon Redshift. | Suivez les meilleures pratiques d'Amazon Redshift en effectuant une preuve de concept (PoC) pour la conception de votre base de données. Pour plus d'informations, consultez la section Réalisation d'une preuve de concept pour Amazon Redshift dans la documentation Amazon Redshift. | DBA |
Créez des utilisateurs de base de données. | Créez les utilisateurs dans votre base de données Amazon Redshift et accordez les rôles appropriés pour accéder au schéma et aux tables. Pour plus d'informations, consultez la section Accorder des privilèges d'accès à un utilisateur ou à un groupe d'utilisateurs dans la documentation Amazon Redshift. | DBA |
Appliquez les paramètres de configuration à la base de données cible. | Appliquez les paramètres de configuration à la base de données Amazon Redshift en fonction de vos besoins. Pour plus d'informations sur l'activation des paramètres de base de données, de session et de niveau serveur, consultez la référence de configuration dans la documentation Amazon Redshift. | DBA |
Tâche | Description | Compétences requises |
---|---|---|
Créez manuellement des tables avec DDL dans Amazon Redshift. | (Facultatif) Si vous utilisez AWS SCT, les tables sont créées automatiquement. Toutefois, en cas d'échec lors de la réplication DDLs, vous devez créer les tables manuellement | DBA |
Créez des tables externes pour Redshift Spectrum. | Créez une table externe avec un schéma externe pour Amazon Redshift Spectrum. Pour créer des tables externes, vous devez être le propriétaire du schéma externe ou un superutilisateur de base de données. Pour plus d'informations, consultez la section Création de tables externes pour Amazon Redshift Spectrum dans la documentation Amazon Redshift. | DBA |
Tâche | Description | Compétences requises |
---|---|---|
Utilisez AWS DMS pour migrer les données. | Après avoir créé le DDL des tables dans la base de données Amazon Redshift, migrez vos données vers Amazon Redshift à l'aide d'AWS DMS. Pour obtenir des instructions et des étapes détaillées, consultez la section Utilisation d'une base de données Amazon Redshift comme cible pour AWS DMS dans la documentation AWS DMS. | DBA |
Utilisez la commande COPY pour charger les données. | Utilisez la Pour plus d'informations, consultez la section Utilisation de la commande COPY pour charger depuis Amazon S3 dans la documentation Amazon Redshift. | DBA |
Tâche | Description | Compétences requises |
---|---|---|
Validez les enregistrements source et cible. | Validez le nombre de tables pour les enregistrements source et cible chargés depuis votre système source. | DBA |
Mettez en œuvre les meilleures pratiques d'Amazon Redshift pour optimiser les performances. | Mettez en œuvre les meilleures pratiques d'Amazon Redshift pour la conception de tables et de bases de données. Pour plus d'informations, consultez le billet de blog Les 10 meilleures techniques d'optimisation des performances pour Amazon Redshift | DBA |
Optimisez les performances des requêtes. | Amazon Redshift utilise des requêtes SQL pour interagir avec les données et les objets du système. Le langage de manipulation de données (DML) est le sous-ensemble du langage SQL que vous pouvez utiliser pour afficher, ajouter, modifier et supprimer des données. Le DDL est le sous-ensemble de SQL que vous utilisez pour ajouter, modifier et supprimer des objets de base de données tels que des tables et des vues. Pour plus d'informations, consultez la section Optimisation des performances des requêtes dans la documentation Amazon Redshift. | DBA |
Implémentez le WLM. | Vous pouvez utiliser la gestion de la charge de travail (WLM) pour définir plusieurs files d'attente de requêtes et acheminer les requêtes vers les files d'attente appropriées lors de l'exécution. Pour plus d'informations, consultez Implémentation de la gestion de la charge de travail dans la documentation Amazon Redshift. | DBA |
Travaillez avec la mise à l'échelle simultanée. | En utilisant la fonctionnalité Concurrency Scaling, vous pouvez prendre en charge un nombre pratiquement illimité d'utilisateurs simultanés et de requêtes simultanées, avec des performances de requête toujours rapides. Pour plus d'informations, consultez la section Utilisation du dimensionnement simultané dans la documentation Amazon Redshift. | DBA |
Utilisez les meilleures pratiques d'Amazon Redshift pour la conception des tables. | Lorsque vous planifiez votre base de données, certaines décisions importantes relatives à la conception des tables peuvent fortement influencer les performances globales des requêtes. Pour plus d'informations sur le choix de l'option de conception de table la plus appropriée, consultez les meilleures pratiques d'Amazon Redshift pour la conception de tables dans la documentation Amazon Redshift. | DBA |
Créez des vues matérialisées dans Amazon Redshift. | Une vue matérialisée contient un ensemble de résultats précalculés basé sur une requête SQL sur une ou plusieurs tables de base. Vous pouvez émettre Pour plus d'informations, consultez la section Création de vues matérialisées dans Amazon Redshift dans la documentation Amazon Redshift. | DBA |
Définissez les jointures entre les tables. | Pour effectuer une recherche dans plusieurs tables à la fois ThoughtSpot, vous devez définir les jointures entre les tables en spécifiant les colonnes contenant les données correspondantes dans deux tables. Ces colonnes représentent la fin Vous pouvez les définir à l'aide de la | DBA |
Tâche | Description | Compétences requises |
---|---|---|
Ajoutez une connexion Amazon Redshift. | Ajoutez une connexion Amazon Redshift à votre base de données Falçon sur site. ThoughtSpot Pour plus d'informations, consultez la section Ajouter une connexion Amazon Redshift | DBA |
Modifiez la connexion Amazon Redshift. | Vous pouvez modifier la connexion Amazon Redshift pour ajouter des tables et des colonnes. Pour plus d'informations, consultez Modifier une connexion Amazon Redshift | DBA |
Remappez la connexion Amazon Redshift. | Modifiez les paramètres de connexion en modifiant le fichier de mappage source .yaml créé lorsque vous avez ajouté la connexion Amazon Redshift. Par exemple, vous pouvez remapper la table ou la colonne existante à une autre table ou colonne dans une connexion à une base de données existante. ThoughtSpot recommande de vérifier les dépendances avant et après le remappage d'une table ou d'une colonne dans une connexion afin de s'assurer qu'elles s'affichent comme prévu. Pour plus d'informations, consultez Remapper une connexion Amazon Redshift | DBA |
Supprimez une table de la connexion Amazon Redshift. | (Facultatif) Si vous tentez de supprimer une table dans une connexion Amazon Redshift, vérifiez ThoughtSpot les dépendances et affiche une liste des objets dépendants. Vous pouvez choisir les objets répertoriés pour les supprimer ou supprimer la dépendance. Vous pouvez ensuite retirer le tableau. Pour plus d'informations, consultez Supprimer une table d'une connexion Amazon Redshift | DBA |
Supprimez une table contenant des objets dépendants d'une connexion Amazon Redshift. | (Facultatif) Si vous essayez de supprimer un tableau contenant des objets dépendants, l'opération est bloquée. Une Pour plus d'informations, consultez Supprimer une table contenant des objets dépendants d'une connexion Amazon Redshift | DBA |
Supprimez une connexion Amazon Redshift. | (Facultatif) Comme une connexion peut être utilisée dans plusieurs sources de données ou visualisations, vous devez supprimer toutes les sources et tâches qui utilisent cette connexion avant de pouvoir supprimer la connexion Amazon Redshift. Pour plus d'informations, consultez Supprimer une connexion Amazon Redshift | DBA |
Vérifiez la référence de connexion pour Amazon Redshift. | Assurez-vous de fournir les informations requises pour votre connexion Amazon Redshift en utilisant la référence de connexion | DBA |