Migrer une base de données ThoughtSpot Falçon sur site vers Amazon Redshift - Recommandations AWS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Migrer une base de données ThoughtSpot Falçon sur site vers Amazon Redshift

Créée par Battulga Purevragchaa (AWS) et Antony Prasad Thevaraj (AWS)

Récapitulatif

Les entrepôts de données sur site nécessitent beaucoup de temps et de ressources d'administration, en particulier pour les grands ensembles de données. Le coût financier de la construction, de l'entretien et de la croissance de ces entrepôts est également très élevé. Pour vous aider à gérer les coûts, à réduire la complexité de l'extraction, de la transformation et du chargement (ETL) et à optimiser les performances à mesure que vos données augmentent, vous devez constamment choisir les données à charger et les données à archiver.

En migrant vos bases de données ThoughtSpot Falçon sur site vers le cloud Amazon Web Services (AWS), vous pouvez accéder à des lacs de données et à des entrepôts de données basés sur le cloud qui améliorent l'agilité, la sécurité et la fiabilité des applications de votre entreprise, tout en réduisant vos coûts d'infrastructure globaux. Amazon Redshift permet de réduire de manière significative les coûts et les frais opérationnels d'un entrepôt de données. Vous pouvez également utiliser Amazon Redshift Spectrum pour analyser de grandes quantités de données dans son format natif sans les charger.

Ce modèle décrit les étapes et le processus de migration d'une base de données ThoughtSpot Falçon d'un centre de données sur site vers une base de données Amazon Redshift sur le cloud AWS.

Conditions préalables et limitations

Prérequis

  • Un compte AWS actif

  • Une base de données ThoughtSpot Falçon hébergée dans un centre de données sur site

Versions du produit

  • ThoughtSpot version 7.0.1 

Architecture

Migration d'une base de données ThoughtSpot Falçon depuis un centre de données sur site vers Amazon Redshift.

Le schéma suivant illustre le flux de travail suivant :

  1. Les données sont hébergées dans une base de données relationnelle sur site.

  2. AWS Schema Conversion Tool (AWS SCT) convertit le langage de définition de données (DDL) compatible avec Amazon Redshift.

  3. Une fois les tables créées, vous pouvez migrer les données à l'aide d'AWS Database Migration Service (AWS DMS).

  4. Les données sont chargées dans Amazon Redshift.

  5. Les données sont stockées dans Amazon Simple Storage Service (Amazon S3) si vous utilisez Redshift Spectrum ou si vous hébergez déjà les données dans Amazon S3.

Outils

  • AWS DMS — AWS Data Migration Service (AWS DMS) vous aide à migrer rapidement et en toute sécurité des bases de données vers AWS.

  • Amazon Redshift — Amazon Redshift est un service d'entrepôt de données rapide, entièrement géré et de plusieurs pétaoctets qui permet d'analyser de manière simple et rentable toutes vos données à l'aide de vos outils de business intelligence existants.

  • AWS SCT — AWS Schema Conversion Tool (AWS SCT) convertit votre schéma de base de données existant d'un moteur de base de données à un autre.

Épopées

TâcheDescriptionCompétences requises

Identifiez la configuration Amazon Redshift appropriée.

Identifiez la configuration de cluster Amazon Redshift appropriée en fonction de vos besoins et du volume de données. 

Pour plus d'informations, consultez les clusters Amazon Redshift dans la documentation Amazon Redshift.

DBA

Faites des recherches sur Amazon Redshift pour déterminer s'il répond à vos besoins.

Utilisez Amazon Redshift FAQs pour comprendre et évaluer si Amazon Redshift répond à vos exigences.

DBA
TâcheDescriptionCompétences requises

Créez un cluster Amazon Redshift.

Connectez-vous à l'AWS Management Console, ouvrez la console Amazon Redshift, puis créez un cluster Amazon Redshift dans un cloud privé virtuel (VPC). 

Pour plus d'informations, consultez la section Création d'un cluster dans un VPC dans la documentation Amazon Redshift.

DBA

Réalisez un PoC pour la conception de votre base de données Amazon Redshift.

Suivez les meilleures pratiques d'Amazon Redshift en effectuant une preuve de concept (PoC) pour la conception de votre base de données. 

Pour plus d'informations, consultez la section Réalisation d'une preuve de concept pour Amazon Redshift dans la documentation Amazon Redshift.

DBA

Créez des utilisateurs de base de données.

Créez les utilisateurs dans votre base de données Amazon Redshift et accordez les rôles appropriés pour accéder au schéma et aux tables.  

Pour plus d'informations, consultez la section Accorder des privilèges d'accès à un utilisateur ou à un groupe d'utilisateurs dans la documentation Amazon Redshift.

DBA

Appliquez les paramètres de configuration à la base de données cible.

Appliquez les paramètres de configuration à la base de données Amazon Redshift en fonction de vos besoins. 

Pour plus d'informations sur l'activation des paramètres de base de données, de session et de niveau serveur, consultez la référence de configuration dans la documentation Amazon Redshift.

DBA
TâcheDescriptionCompétences requises

Créez manuellement des tables avec DDL dans Amazon Redshift.

(Facultatif) Si vous utilisez AWS SCT, les tables sont créées automatiquement. Toutefois, en cas d'échec lors de la réplication DDLs, vous devez créer les tables manuellement

DBA

Créez des tables externes pour Redshift Spectrum.

Créez une table externe avec un schéma externe pour Amazon Redshift Spectrum. Pour créer des tables externes, vous devez être le propriétaire du schéma externe ou un superutilisateur de base de données

Pour plus d'informations, consultez la section Création de tables externes pour Amazon Redshift Spectrum dans la documentation Amazon Redshift.

DBA
TâcheDescriptionCompétences requises

Utilisez AWS DMS pour migrer les données.

Après avoir créé le DDL des tables dans la base de données Amazon Redshift, migrez vos données vers Amazon Redshift à l'aide d'AWS DMS.

Pour obtenir des instructions et des étapes détaillées, consultez la section Utilisation d'une base de données Amazon Redshift comme cible pour AWS DMS dans la documentation AWS DMS.

DBA

Utilisez la commande COPY pour charger les données.

Utilisez la COPY commande Amazon Redshift pour charger les données d'Amazon S3 vers Amazon Redshift.

Pour plus d'informations, consultez la section Utilisation de la commande COPY pour charger depuis Amazon S3 dans la documentation Amazon Redshift.

DBA
TâcheDescriptionCompétences requises

Validez les enregistrements source et cible.

Validez le nombre de tables pour les enregistrements source et cible chargés depuis votre système source.

DBA

Mettez en œuvre les meilleures pratiques d'Amazon Redshift pour optimiser les performances.

Mettez en œuvre les meilleures pratiques d'Amazon Redshift pour la conception de tables et de bases de données. 

Pour plus d'informations, consultez le billet de blog Les 10 meilleures techniques d'optimisation des performances pour Amazon Redshift.

DBA

Optimisez les performances des requêtes.

Amazon Redshift utilise des requêtes SQL pour interagir avec les données et les objets du système. Le langage de manipulation de données (DML) est le sous-ensemble du langage SQL que vous pouvez utiliser pour afficher, ajouter, modifier et supprimer des données. Le DDL est le sous-ensemble de SQL que vous utilisez pour ajouter, modifier et supprimer des objets de base de données tels que des tables et des vues.

Pour plus d'informations, consultez la section Optimisation des performances des requêtes dans la documentation Amazon Redshift.

DBA

Implémentez le WLM.

Vous pouvez utiliser la gestion de la charge de travail (WLM) pour définir plusieurs files d'attente de requêtes et acheminer les requêtes vers les files d'attente appropriées lors de l'exécution.

Pour plus d'informations, consultez Implémentation de la gestion de la charge de travail dans la documentation Amazon Redshift.

DBA

Travaillez avec la mise à l'échelle simultanée.

En utilisant la fonctionnalité Concurrency Scaling, vous pouvez prendre en charge un nombre pratiquement illimité d'utilisateurs simultanés et de requêtes simultanées, avec des performances de requête toujours rapides.

Pour plus d'informations, consultez la section Utilisation du dimensionnement simultané dans la documentation Amazon Redshift.

DBA

Utilisez les meilleures pratiques d'Amazon Redshift pour la conception des tables.

Lorsque vous planifiez votre base de données, certaines décisions importantes relatives à la conception des tables peuvent fortement influencer les performances globales des requêtes.

Pour plus d'informations sur le choix de l'option de conception de table la plus appropriée, consultez les meilleures pratiques d'Amazon Redshift pour la conception de tables dans la documentation Amazon Redshift.

DBA

Créez des vues matérialisées dans Amazon Redshift.

Une vue matérialisée contient un ensemble de résultats précalculés basé sur une requête SQL sur une ou plusieurs tables de base. Vous pouvez émettre SELECT des instructions pour interroger une vue matérialisée de la même manière que vous interrogez d'autres tables ou vues de la base de données.

Pour plus d'informations, consultez la section Création de vues matérialisées dans Amazon Redshift dans la documentation Amazon Redshift.

DBA

Définissez les jointures entre les tables.

Pour effectuer une recherche dans plusieurs tables à la fois ThoughtSpot, vous devez définir les jointures entre les tables en spécifiant les colonnes contenant les données correspondantes dans deux tables. Ces colonnes représentent la fin primary key foreign key de la jointure.

Vous pouvez les définir à l'aide de la ALTER TABLE commande dans Amazon Redshift ou. ThoughtSpot Pour plus d'informations, consultez ALTER TABLE dans la documentation Amazon Redshift.

DBA
TâcheDescriptionCompétences requises

Ajoutez une connexion Amazon Redshift.

Ajoutez une connexion Amazon Redshift à votre base de données Falçon sur site. ThoughtSpot

Pour plus d'informations, consultez la section Ajouter une connexion Amazon Redshift dans la ThoughtSpot documentation.

DBA

Modifiez la connexion Amazon Redshift.

Vous pouvez modifier la connexion Amazon Redshift pour ajouter des tables et des colonnes.

Pour plus d'informations, consultez Modifier une connexion Amazon Redshift dans la ThoughtSpot documentation.

DBA

Remappez la connexion Amazon Redshift.

Modifiez les paramètres de connexion en modifiant le fichier de mappage source .yaml créé lorsque vous avez ajouté la connexion Amazon Redshift. 

Par exemple, vous pouvez remapper la table ou la colonne existante à une autre table ou colonne dans une connexion à une base de données existante. ThoughtSpot recommande de vérifier les dépendances avant et après le remappage d'une table ou d'une colonne dans une connexion afin de s'assurer qu'elles s'affichent comme prévu.

Pour plus d'informations, consultez Remapper une connexion Amazon Redshift dans ThoughtSpot la documentation.

DBA

Supprimez une table de la connexion Amazon Redshift.

(Facultatif) Si vous tentez de supprimer une table dans une connexion Amazon Redshift, vérifiez ThoughtSpot les dépendances et affiche une liste des objets dépendants. Vous pouvez choisir les objets répertoriés pour les supprimer ou supprimer la dépendance. Vous pouvez ensuite retirer le tableau.

Pour plus d'informations, consultez Supprimer une table d'une connexion Amazon Redshift dans la ThoughtSpot documentation.

DBA

Supprimez une table contenant des objets dépendants d'une connexion Amazon Redshift.

(Facultatif) Si vous essayez de supprimer un tableau contenant des objets dépendants, l'opération est bloquée. Une Cannot delete fenêtre apparaît, avec une liste de liens vers des objets dépendants. Lorsque toutes les dépendances sont supprimées, vous pouvez supprimer la table

Pour plus d'informations, consultez Supprimer une table contenant des objets dépendants d'une connexion Amazon Redshift dans la ThoughtSpot documentation.

DBA

Supprimez une connexion Amazon Redshift.

(Facultatif) Comme une connexion peut être utilisée dans plusieurs sources de données ou visualisations, vous devez supprimer toutes les sources et tâches qui utilisent cette connexion avant de pouvoir supprimer la connexion Amazon Redshift.

Pour plus d'informations, consultez Supprimer une connexion Amazon Redshift dans la ThoughtSpot documentation.

DBA

Vérifiez la référence de connexion pour Amazon Redshift.

Assurez-vous de fournir les informations requises pour votre connexion Amazon Redshift en utilisant la référence de connexion figurant dans la ThoughtSpot documentation.

DBA

Informations supplémentaires