Migrieren Sie eine lokale ThoughtSpot Falcon-Datenbank zu Amazon Redshift - AWS Prescriptive Guidance

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Migrieren Sie eine lokale ThoughtSpot Falcon-Datenbank zu Amazon Redshift

Erstellt von Battulga Purevragchaa () und Antony Prasad Thevaraj () AWS AWS

Umgebung: PoC oder Pilotprojekt

Quelle: Lokale Falcon-Datenbank ThoughtSpot

Ziel: Amazon Redshift

R-Typ: Re-Architect

Arbeitslast: Alle anderen Workloads

Technologien: Migration; Datenbanken

AWSDienste: AWSDMS; Amazon Redshift

Übersicht

Lokale Data Warehouses erfordern viel Verwaltungszeit und Ressourcen, insbesondere bei großen Datensätzen. Die finanziellen Kosten für den Bau, die Wartung und den Ausbau dieser Lagerhäuser sind ebenfalls sehr hoch. Um die Kosten im Griff zu behalten, die Komplexität von Extrahieren, Transformieren und Laden (ETL) gering zu halten und Leistung bereitzustellen, wenn Ihre Daten wachsen, müssen Sie ständig entscheiden, welche Daten geladen und welche archiviert werden sollen.

Durch die Migration Ihrer lokalen ThoughtSpot Falcon-Datenbanken in die Amazon Web Services (AWS) Cloud können Sie auf Cloud-basierte Data Lakes und Data Warehouses zugreifen, die Ihre geschäftliche Flexibilität, Sicherheit und Anwendungszuverlässigkeit erhöhen und gleichzeitig Ihre gesamten Infrastrukturkosten senken. Amazon Redshift trägt dazu bei, die Kosten und den Betriebskosten eines Data Warehouse erheblich zu senken. Sie können Amazon Redshift Spectrum auch verwenden, um große Datenmengen im nativen Format zu analysieren, ohne dass Daten geladen werden müssen.

Dieses Muster beschreibt die Schritte und den Prozess für die Migration einer ThoughtSpot Falcon-Datenbank von einem lokalen Rechenzentrum zu einer Amazon Redshift Redshift-Datenbank in der Cloud. AWS

Voraussetzungen und Einschränkungen

Voraussetzungen

  • Ein aktives Konto AWS

  • Eine ThoughtSpot Falcon-Datenbank, die in einem lokalen Rechenzentrum gehostet wird

Produktversionen

  • ThoughtSpot Version 7.0.1 

Architektur

Migration einer ThoughtSpot Falcon-Datenbank von einem lokalen Rechenzentrum zu Amazon Redshift.

Das Diagramm zeigt den folgenden Workflow:

  1. Die Daten werden in einer lokalen relationalen Datenbank gehostet.

  2. AWSDas Schema Conversion Tool (AWSSCT) konvertiert die Datendefinitionssprache (DDL), die mit Amazon Redshift kompatibel ist.

  3. Nachdem die Tabellen erstellt wurden, können Sie die Daten mithilfe des AWS Database Migration Service (AWSDMS) migrieren.

  4. Die Daten werden in Amazon Redshift geladen.

  5. Die Daten werden in Amazon Simple Storage Service (Amazon S3) gespeichert, wenn Sie Redshift Spectrum verwenden oder die Daten bereits in Amazon S3 hosten.

Tools

  • AWSDMS— AWS Data Migration Service (AWSDMS) hilft Ihnen dabei, Datenbanken schnell und sicher zu AWS migrieren.

  • Amazon Redshift — Amazon Redshift ist ein schneller, vollständig verwalteter Data Warehouse-Service im Petabyte-Bereich, mit dem Sie all Ihre Daten mithilfe Ihrer vorhandenen Business Intelligence-Tools einfach und kostengünstig effizient analysieren können.

  • AWSSCT— Das AWS Schema Conversion Tool (AWSSCT) konvertiert Ihr vorhandenes Datenbankschema von einer Datenbank-Engine in eine andere.

Epen

AufgabeBeschreibungErforderliche Fähigkeiten

Identifizieren Sie die entsprechende Amazon Redshift Redshift-Konfiguration.

Identifizieren Sie die passende Amazon Redshift Redshift-Cluster-Konfiguration auf der Grundlage Ihrer Anforderungen und Ihres Datenvolumens. 

Weitere Informationen finden Sie unter Amazon Redshift Redshift-Cluster in der Amazon Redshift Redshift-Dokumentation.

DBA

Informieren Sie sich über Amazon Redshift, um herauszufinden, ob es Ihren Anforderungen entspricht.

Verwenden Sie Amazon Redshift FAQs, um zu verstehen und zu bewerten, ob Amazon Redshift Ihre Anforderungen erfüllt.

DBA
AufgabeBeschreibungErforderliche Fähigkeiten

Erstellen Sie einen Amazon Redshift Redshift-Cluster.

Melden Sie sich bei der AWS Management Console an, öffnen Sie die Amazon Redshift Redshift-Konsole und erstellen Sie dann einen Amazon Redshift Redshift-Cluster in einer virtuellen privaten Cloud ()VPC. 

Weitere Informationen finden Sie unter Erstellen eines Clusters in einem VPC in der Amazon Redshift Redshift-Dokumentation.

DBA

Führen Sie einen PoC für Ihr Amazon Redshift Redshift-Datenbankdesign durch.

Folgen Sie den Best Practices von Amazon Redshift, indem Sie einen Machbarkeitsnachweis (PoC) für Ihr Datenbankdesign durchführen. 

Weitere Informationen finden Sie unter Durchführung eines Machbarkeitsnachweises für Amazon Redshift in der Amazon Redshift Redshift-Dokumentation.

DBA

Datenbankbenutzer erstellen.

Erstellen Sie die Benutzer in Ihrer Amazon Redshift Redshift-Datenbank und gewähren Sie die entsprechenden Rollen für den Zugriff auf das Schema und die Tabellen.  

Weitere Informationen finden Sie unter Gewähren von Zugriffsberechtigungen für einen Benutzer oder eine Benutzergruppe in der Amazon Redshift Redshift-Dokumentation.

DBA

Wenden Sie die Konfigurationseinstellungen auf die Zieldatenbank an.

Wenden Sie die Konfigurationseinstellungen entsprechend Ihren Anforderungen auf die Amazon Redshift Redshift-Datenbank an. 

Weitere Informationen zur Aktivierung von Parametern auf Datenbank-, Sitzungs- und Serverebene finden Sie in der Konfigurationsreferenz in der Amazon Redshift Redshift-Dokumentation.

DBA
AufgabeBeschreibungErforderliche Fähigkeiten

Manuelles Erstellen von Tabellen DDL in Amazon Redshift.

(Optional) Wenn Sie dies verwenden AWSSCT, werden die Tabellen automatisch erstellt. Wenn bei der Replikation jedoch Fehler auftretenDDLs, müssen Sie die Tabellen manuell erstellen

DBA

Erstellen Sie externe Tabellen für Redshift Spectrum.

Erstellen Sie eine externe Tabelle mit einem externen Schema für Amazon Redshift Spectrum. Um externe Tabellen zu erstellen, müssen Sie der Eigentümer des externen Schemas oder ein Datenbank-Superuser sein. 

Weitere Informationen finden Sie unter Erstellen externer Tabellen für Amazon Redshift Spectrum in der Amazon Redshift-Dokumentation.

DBA
AufgabeBeschreibungErforderliche Fähigkeiten

Wird verwendet AWSDMS, um die Daten zu migrieren.

Nachdem Sie die Tabellen in DDL der Amazon Redshift-Datenbank erstellt haben, migrieren Sie Ihre Daten zu Amazon Redshift mithilfe von. AWS DMS

Ausführliche Schritte und Anweisungen finden Sie in der AWS DMS Dokumentation unter Verwenden einer Amazon Redshift Redshift-Datenbank als Ziel für AWS DMS.

DBA

Verwenden Sie den COPY Befehl, um die Daten zu laden.

Verwenden Sie den Amazon COPY Redshift-Befehl, um die Daten von Amazon S3 nach Amazon Redshift zu laden.

Weitere Informationen finden Sie unter Verwenden des COPY Befehls zum Laden aus Amazon S3 in der Amazon Redshift Redshift-Dokumentation.

DBA
AufgabeBeschreibungErforderliche Fähigkeiten

Validieren Sie die Quell- und Zieldatensätze.

Überprüfen Sie die Tabellenanzahl für die Quell- und Zieldatensätze, die aus Ihrem Quellsystem geladen wurden.

DBA

Implementieren Sie die Best Practices von Amazon Redshift zur Leistungsoptimierung.

Implementieren Sie die Best Practices von Amazon Redshift für das Tabellen- und Datenbankdesign. 

Weitere Informationen finden Sie im Blogbeitrag Die 10 wichtigsten Techniken zur Leistungsoptimierung für Amazon Redshift.

DBA

Optimieren Sie die Abfrageleistung.

Amazon Redshift verwendet SQL basierte Abfragen, um mit Daten und Objekten im System zu interagieren. Die Datenmanipulationssprache (DML) ist die TeilmengeSQL, mit der Sie Daten anzeigen, hinzufügen, ändern und löschen können. DDList die TeilmengeSQL, die Sie zum Hinzufügen, Ändern und Löschen von Datenbankobjekten wie Tabellen und Ansichten verwenden.

Weitere Informationen finden Sie unter Optimieren der Abfrageleistung in der Amazon Redshift Redshift-Dokumentation.

DBA

ImplementierenWLM.

Sie können Workload Management (WLM) verwenden, um mehrere Abfragewarteschlangen zu definieren und Abfragen zur Laufzeit an die entsprechenden Warteschlangen weiterzuleiten.

Weitere Informationen finden Sie unter Implementieren des Workload-Managements in der Amazon Redshift Redshift-Dokumentation.

DBA

Arbeiten Sie mit Parallelitätsskalierung.

Mithilfe der Concurrency Scaling-Funktion können Sie praktisch unbegrenzt viele gleichzeitige Benutzer und Abfragen bei gleichbleibend schneller Abfrageleistung unterstützen.

Weitere Informationen finden Sie unter Arbeiten mit Parallelitätsskalierung in der Amazon Redshift Redshift-Dokumentation.

DBA

Verwenden Sie die Best Practices von Amazon Redshift für das Tabellendesign.

Bei der Planung Ihrer Datenbank können bestimmte wichtige Entscheidungen beim Tabellenentwurf die allgemeine Abfrageleistung stark beeinflussen.

Weitere Informationen zur Auswahl der am besten geeigneten Tabellenentwurfsoption finden Sie unter Bewährte Methoden für das Entwerfen von Tabellen für Amazon Redshift in der Amazon Redshift-Dokumentation.

DBA

Erstellen Sie materialisierte Ansichten in Amazon Redshift.

Eine materialisierte Ansicht enthält einen vorberechneten Ergebnissatz, der auf einer SQL Abfrage über eine oder mehrere Basistabellen basiert. Sie können SELECT Anweisungen zur Abfrage einer materialisierten Ansicht genauso ausgeben, wie Sie andere Tabellen oder Ansichten in der Datenbank abfragen.

Weitere Informationen finden Sie unter Erstellen materialisierter Ansichten in Amazon Redshift in der Amazon Redshift Redshift-Dokumentation.

DBA

Definieren Sie Verknüpfungen zwischen den Tabellen.

Um in mehr als einer Tabelle gleichzeitig zu suchen ThoughtSpot, müssen Sie Verknüpfungen zwischen den Tabellen definieren, indem Sie Spalten angeben, die übereinstimmende Daten aus zwei Tabellen enthalten. Diese Spalten stellen das primary key Ende foreign key der Verknüpfung dar.

Sie können sie mit dem ALTER TABLE Befehl in Amazon Redshift oder ThoughtSpot definieren. Weitere Informationen finden Sie ALTERTABLEin der Amazon Redshift Redshift-Dokumentation.

DBA
AufgabeBeschreibungErforderliche Fähigkeiten

Fügen Sie eine Amazon Redshift Redshift-Verbindung hinzu.

Fügen Sie Ihrer lokalen ThoughtSpot Falcon-Datenbank eine Amazon Redshift Redshift-Verbindung hinzu.

Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Hinzufügen einer Amazon Redshift Redshift-Verbindung.

DBA

Bearbeiten Sie die Amazon Redshift Redshift-Verbindung.

Sie können die Amazon Redshift Redshift-Verbindung bearbeiten, um Tabellen und Spalten hinzuzufügen.

Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Bearbeiten einer Amazon Redshift Redshift-Verbindung.

DBA

Ordnen Sie die Amazon Redshift Redshift-Verbindung neu zu.

Ändern Sie die Verbindungsparameter, indem Sie die Quell-Mapping-.yaml-Datei bearbeiten, die beim Hinzufügen der Amazon Redshift Redshift-Verbindung erstellt wurde. 

Sie können beispielsweise die bestehende Tabelle oder Spalte einer anderen Tabelle oder Spalte in einer bestehenden Datenbankverbindung neu zuordnen. ThoughtSpot empfiehlt, die Abhängigkeiten vor und nach der Neuzuweisung einer Tabelle oder Spalte in einer Verbindung zu überprüfen, um sicherzustellen, dass sie wie gewünscht angezeigt werden.

Weitere Informationen finden Sie in der Dokumentation unter Eine Amazon Redshift Redshift-Verbindung neu zuordnen. ThoughtSpot

DBA

Löschen Sie eine Tabelle aus der Amazon Redshift Redshift-Verbindung.

(Optional) Wenn Sie versuchen, eine Tabelle in einer Amazon Redshift Redshift-Verbindung zu entfernen, ThoughtSpot sucht es nach Abhängigkeiten und zeigt eine Liste der abhängigen Objekte an. Sie können die aufgelisteten Objekte auswählen, um sie zu löschen oder die Abhängigkeit zu entfernen. Anschließend können Sie die Tabelle entfernen.

Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Löschen einer Tabelle aus einer Amazon Redshift Redshift-Verbindung.

DBA

Löschen Sie eine Tabelle mit abhängigen Objekten aus einer Amazon Redshift Redshift-Verbindung.

(Optional) Wenn Sie versuchen, eine Tabelle mit abhängigen Objekten zu löschen, wird der Vorgang blockiert. Ein Cannot delete Fenster mit einer Liste von Links zu abhängigen Objekten wird angezeigt. Wenn alle Abhängigkeiten entfernt wurden, können Sie die Tabelle löschen

Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Löschen einer Tabelle mit abhängigen Objekten aus einer Amazon Redshift Redshift-Verbindung.

DBA

Löschen Sie eine Amazon Redshift Redshift-Verbindung.

(Optional) Da eine Verbindung in mehreren Datenquellen oder Visualisierungen verwendet werden kann, müssen Sie alle Quellen und Aufgaben löschen, die diese Verbindung verwenden, bevor Sie die Amazon Redshift Redshift-Verbindung löschen können.

Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Löschen einer Amazon Redshift Redshift-Verbindung.

DBA

Überprüfen Sie die Verbindungsreferenz für Amazon Redshift.

Stellen Sie sicher, dass Sie die erforderlichen Informationen für Ihre Amazon Redshift Redshift-Verbindung angeben, indem Sie die Verbindungsreferenz in der ThoughtSpot Dokumentation verwenden.

DBA

Zusätzliche Informationen