Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Esegui la migrazione di un database ThoughtSpot Falcon locale su Amazon Redshift
Creato da Battulga Purevragchaa () e Antony Prasad Thevaraj () AWS AWS
Riepilogo
I data warehouse locali richiedono tempi e risorse di amministrazione significativi, in particolare per set di dati di grandi dimensioni. Anche il costo finanziario della costruzione, della manutenzione e della crescita di questi magazzini è molto elevato. Per aiutare a gestire i costi, mantenere bassa la complessità di estrazione, trasformazione e caricamento (ETL) e fornire prestazioni man mano che i dati crescono, è necessario scegliere costantemente quali dati caricare e quali archiviare.
Migrando i database ThoughtSpot Falcon
Questo modello descrive i passaggi e il processo per la migrazione di un database ThoughtSpot Falcon da un data center locale a un database Amazon Redshift sul cloud. AWS
Prerequisiti e limitazioni
Prerequisiti
Un account attivo AWS
Un database ThoughtSpot Falcon ospitato in un data center locale
Versioni del prodotto
ThoughtSpot versione 7.0.1
Architettura
![Migrazione di un database ThoughtSpot Falcon da un data center locale ad Amazon Redshift.](images/pattern-img/b0ca29f4-b269-4b57-b386-738693a6b334/images/2b483990-1f30-439c-ba13-dc0cb0650360.png)
Il diagramma mostra il flusso di lavoro seguente:
I dati sono ospitati in un database relazionale locale.
AWSSchema Conversion Tool (AWSSCT) converte il linguaggio di definizione dei dati (DDL) compatibile con Amazon Redshift.
Dopo aver creato le tabelle, è possibile migrare i dati utilizzando AWS Database Migration Service (AWSDMS).
I dati vengono caricati in Amazon Redshift.
I dati vengono archiviati in Amazon Simple Storage Service (Amazon S3) se utilizzi Redshift Spectrum o se hai già ospitato i dati in Amazon S3.
Strumenti
AWSDMS— AWS Data Migration Service (AWSDMS) ti aiuta a migrare i database in modo rapido e sicuro verso. AWS
Amazon Redshift — Amazon Redshift è un servizio di data warehouse veloce, completamente gestito e su scala petabyte che semplifica ed economica l'analisi efficiente di tutti i dati utilizzando gli strumenti di business intelligence esistenti.
AWSSCT— AWS Schema Conversion Tool (AWSSCT) converte lo schema del database esistente da un motore di database a un altro.
Epiche
Attività | Descrizione | Competenze richieste |
---|---|---|
Identifica la configurazione Amazon Redshift appropriata. | Identifica la configurazione del cluster Amazon Redshift appropriata in base ai tuoi requisiti e al volume di dati. Per ulteriori informazioni, consulta i cluster Amazon Redshift nella documentazione di Amazon Redshift. | DBA |
Cerca Amazon Redshift per valutare se soddisfa i tuoi requisiti. | Usa Amazon Redshift FAQs | DBA |
Attività | Descrizione | Competenze richieste |
---|---|---|
Crea un cluster Amazon Redshift. | Accedi alla console di AWS gestione, apri la console Amazon Redshift e crea un cluster Amazon Redshift in un cloud privato virtuale (). VPC Per ulteriori informazioni, consulta Creazione di un cluster in VPC a nella documentazione di Amazon Redshift. | DBA |
Esegui un PoC per la progettazione del tuo database Amazon Redshift. | Segui le best practice di Amazon Redshift eseguendo un proof of concept (PoC) per la progettazione del tuo database. Per ulteriori informazioni, consulta Condurre un proof of concept per Amazon Redshift nella documentazione di Amazon Redshift. | DBA |
Crea utenti del database. | Crea gli utenti nel tuo database Amazon Redshift e concedi i ruoli appropriati per l'accesso allo schema e alle tabelle. Per ulteriori informazioni, consulta Concedere i privilegi di accesso per un utente o un gruppo di utenti nella documentazione di Amazon Redshift. | DBA |
Applica le impostazioni di configurazione al database di destinazione. | Applica le impostazioni di configurazione al database Amazon Redshift in base ai tuoi requisiti. Per ulteriori informazioni sull'abilitazione dei parametri a livello di database, sessione e server, consulta il riferimento alla configurazione nella documentazione di Amazon Redshift. | DBA |
Attività | Descrizione | Competenze richieste |
---|---|---|
Crea tabelle manualmente con DDL Amazon Redshift. | (Facoltativo) Se utilizzi AWSSCT, le tabelle vengono create automaticamente. Tuttavia, se si verificano errori durante la replicaDDLs, è necessario creare manualmente le tabelle | DBA |
Crea tabelle esterne per Redshift Spectrum. | Crea una tabella esterna con uno schema esterno per Amazon Redshift Spectrum. Per creare tabelle esterne, devi essere il proprietario dello schema esterno o un superutente del database. Per ulteriori informazioni, consulta Creazione di tabelle esterne per Amazon Redshift Spectrum nella documentazione di Amazon Redshift. | DBA |
Attività | Descrizione | Competenze richieste |
---|---|---|
Utilizzare AWS DMS per migrare i dati. | Dopo aver creato le DDL tabelle nel database Amazon Redshift, migra i dati su Amazon Redshift utilizzando. AWS DMS Per passaggi e istruzioni dettagliati, consulta Usare un database Amazon Redshift come destinazione AWS DMS nella AWS DMS documentazione. | DBA |
Usa il COPY comando per caricare i dati. | Usa il Per ulteriori informazioni, consulta Using the COPY command to load from Amazon S3 nella documentazione di Amazon Redshift. | DBA |
Attività | Descrizione | Competenze richieste |
---|---|---|
Convalida i record di origine e di destinazione. | Convalida il conteggio delle tabelle per i record di origine e di destinazione che sono stati caricati dal sistema di origine. | DBA |
Implementa le best practice di Amazon Redshift per l'ottimizzazione delle prestazioni. | Implementa le best practice di Amazon Redshift per la progettazione di tabelle e database. Per ulteriori informazioni, consulta il post sul blog Le 10 migliori tecniche di ottimizzazione delle prestazioni per Amazon Redshift | DBA |
Ottimizza le prestazioni delle query. | Amazon Redshift utilizza query SQL basate per interagire con dati e oggetti nel sistema. Il linguaggio di manipolazione dei dati (DML) è il sottoinsieme SQL che puoi utilizzare per visualizzare, aggiungere, modificare ed eliminare dati. DDLè il sottoinsieme utilizzato per aggiungere, modificare ed eliminare oggetti del database come tabelle e viste. SQL Per ulteriori informazioni, consulta Tuning query performance nella documentazione di Amazon Redshift. | DBA |
Implementa. WLM | È possibile utilizzare workload management (WLM) per definire più code di query e indirizzare le query alle code appropriate in fase di esecuzione. Per ulteriori informazioni, consulta Implementazione della gestione del carico di lavoro nella documentazione di Amazon Redshift. | DBA |
Lavora con la scalabilità simultanea. | Utilizzando la funzionalità Concurrency Scaling, è possibile supportare un numero virtualmente illimitato di utenti e query simultanee, con prestazioni di query costantemente elevate. Per ulteriori informazioni, consulta Working with concurrency scaling nella documentazione di Amazon Redshift. | DBA |
Utilizza le best practice di Amazon Redshift per la progettazione di tabelle. | Quando pianifichi il tuo database, alcune importanti decisioni sulla progettazione delle tabelle possono influenzare fortemente le prestazioni complessive delle query. Per ulteriori informazioni sulla scelta dell'opzione di progettazione delle tabelle più appropriata, consulta le best practice di Amazon Redshift per la progettazione di tabelle nella documentazione di Amazon Redshift. | DBA |
Crea viste materializzate in Amazon Redshift. | Una vista materializzata contiene un set di risultati precalcolato basato su una SQL query su una o più tabelle di base. È possibile emettere Per ulteriori informazioni, consulta Creazione di viste materializzate in Amazon Redshift nella documentazione di Amazon Redshift. | DBA |
Definisci le unioni tra le tabelle. | Per cercare più di una tabella contemporaneamente ThoughtSpot, è necessario definire i join tra le tabelle specificando le colonne che contengono i dati corrispondenti su due tabelle. Queste colonne rappresentano la fine Puoi definirli utilizzando il | DBA |
Attività | Descrizione | Competenze richieste |
---|---|---|
Aggiungi una connessione Amazon Redshift. | Aggiungi una connessione Amazon Redshift al tuo database Falcon locale ThoughtSpot . Per ulteriori informazioni, consulta Aggiungere una connessione Amazon Redshift | DBA |
Modifica la connessione Amazon Redshift. | Puoi modificare la connessione Amazon Redshift per aggiungere tabelle e colonne. Per ulteriori informazioni, consulta Modificare una connessione Amazon Redshift | DBA |
Rimappa la connessione Amazon Redshift. | Modifica i parametri di connessione modificando il file di mappatura dei sorgenti .yaml creato quando hai aggiunto la connessione Amazon Redshift. Ad esempio, puoi rimappare la tabella o la colonna esistente su una tabella o colonna diversa in una connessione al database esistente. ThoughtSpot consiglia di controllare le dipendenze prima e dopo aver rimappato una tabella o una colonna in una connessione per assicurarsi che vengano visualizzate come richiesto. Per ulteriori informazioni, consulta Rimappare una connessione Amazon Redshift | DBA |
Elimina una tabella dalla connessione Amazon Redshift. | (Facoltativo) Se tenti di rimuovere una tabella in una connessione Amazon Redshift, ThoughtSpot verifica le dipendenze e mostra un elenco di oggetti dipendenti. Puoi scegliere gli oggetti elencati per eliminarli o rimuovere la dipendenza. È quindi possibile rimuovere la tabella. Per ulteriori informazioni, consulta Eliminare una tabella da una connessione Amazon Redshift | DBA |
Elimina una tabella con oggetti dipendenti da una connessione Amazon Redshift. | (Facoltativo) Se tenti di eliminare una tabella con oggetti dipendenti, l'operazione viene bloccata. Viene visualizzata una Per ulteriori informazioni, consulta Eliminare una tabella con oggetti dipendenti da una connessione Amazon Redshift | DBA |
Elimina una connessione Amazon Redshift. | (Facoltativo) Poiché una connessione può essere utilizzata in più sorgenti di dati o visualizzazioni, è necessario eliminare tutte le fonti e le attività che utilizzano tale connessione prima di poter eliminare la connessione Amazon Redshift. Per ulteriori informazioni, consulta Eliminare una connessione Amazon Redshift | DBA |
Controlla il riferimento di connessione per Amazon Redshift. | Assicurati di fornire le informazioni richieste per la tua connessione Amazon Redshift utilizzando il riferimento Connection | DBA |