Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Migrieren Sie eine lokale ThoughtSpot Falcon-Datenbank zu Amazon Redshift
Erstellt von Battulga Purevragchaa () und Antony Prasad Thevaraj () AWS AWS
Umgebung: PoC oder Pilotprojekt | Quelle: Lokale Falcon-Datenbank ThoughtSpot | Ziel: Amazon Redshift |
R-Typ: Re-Architect | Arbeitslast: Alle anderen Workloads | Technologien: Migration; Datenbanken |
AWSDienste: AWSDMS; Amazon Redshift |
Übersicht
Lokale Data Warehouses erfordern viel Verwaltungszeit und Ressourcen, insbesondere bei großen Datensätzen. Die finanziellen Kosten für den Bau, die Wartung und den Ausbau dieser Lagerhäuser sind ebenfalls sehr hoch. Um die Kosten im Griff zu behalten, die Komplexität von Extrahieren, Transformieren und Laden (ETL) gering zu halten und Leistung bereitzustellen, wenn Ihre Daten wachsen, müssen Sie ständig entscheiden, welche Daten geladen und welche archiviert werden sollen.
Durch die Migration Ihrer lokalen ThoughtSpot Falcon-Datenbanken
Dieses Muster beschreibt die Schritte und den Prozess für die Migration einer ThoughtSpot Falcon-Datenbank von einem lokalen Rechenzentrum zu einer Amazon Redshift Redshift-Datenbank in der Cloud. AWS
Voraussetzungen und Einschränkungen
Voraussetzungen
Ein aktives Konto AWS
Eine ThoughtSpot Falcon-Datenbank, die in einem lokalen Rechenzentrum gehostet wird
Produktversionen
ThoughtSpot Version 7.0.1
Architektur
Das Diagramm zeigt den folgenden Workflow:
Die Daten werden in einer lokalen relationalen Datenbank gehostet.
AWSDas Schema Conversion Tool (AWSSCT) konvertiert die Datendefinitionssprache (DDL), die mit Amazon Redshift kompatibel ist.
Nachdem die Tabellen erstellt wurden, können Sie die Daten mithilfe des AWS Database Migration Service (AWSDMS) migrieren.
Die Daten werden in Amazon Redshift geladen.
Die Daten werden in Amazon Simple Storage Service (Amazon S3) gespeichert, wenn Sie Redshift Spectrum verwenden oder die Daten bereits in Amazon S3 hosten.
Tools
AWSDMS— AWS Data Migration Service (AWSDMS) hilft Ihnen dabei, Datenbanken schnell und sicher zu AWS migrieren.
Amazon Redshift — Amazon Redshift ist ein schneller, vollständig verwalteter Data Warehouse-Service im Petabyte-Bereich, mit dem Sie all Ihre Daten mithilfe Ihrer vorhandenen Business Intelligence-Tools einfach und kostengünstig effizient analysieren können.
AWSSCT— Das AWS Schema Conversion Tool (AWSSCT) konvertiert Ihr vorhandenes Datenbankschema von einer Datenbank-Engine in eine andere.
Epen
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Identifizieren Sie die entsprechende Amazon Redshift Redshift-Konfiguration. | Identifizieren Sie die passende Amazon Redshift Redshift-Cluster-Konfiguration auf der Grundlage Ihrer Anforderungen und Ihres Datenvolumens. Weitere Informationen finden Sie unter Amazon Redshift Redshift-Cluster in der Amazon Redshift Redshift-Dokumentation. | DBA |
Informieren Sie sich über Amazon Redshift, um herauszufinden, ob es Ihren Anforderungen entspricht. | Verwenden Sie Amazon Redshift FAQs | DBA |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Erstellen Sie einen Amazon Redshift Redshift-Cluster. | Melden Sie sich bei der AWS Management Console an, öffnen Sie die Amazon Redshift Redshift-Konsole und erstellen Sie dann einen Amazon Redshift Redshift-Cluster in einer virtuellen privaten Cloud ()VPC. Weitere Informationen finden Sie unter Erstellen eines Clusters in einem VPC in der Amazon Redshift Redshift-Dokumentation. | DBA |
Führen Sie einen PoC für Ihr Amazon Redshift Redshift-Datenbankdesign durch. | Folgen Sie den Best Practices von Amazon Redshift, indem Sie einen Machbarkeitsnachweis (PoC) für Ihr Datenbankdesign durchführen. Weitere Informationen finden Sie unter Durchführung eines Machbarkeitsnachweises für Amazon Redshift in der Amazon Redshift Redshift-Dokumentation. | DBA |
Datenbankbenutzer erstellen. | Erstellen Sie die Benutzer in Ihrer Amazon Redshift Redshift-Datenbank und gewähren Sie die entsprechenden Rollen für den Zugriff auf das Schema und die Tabellen. Weitere Informationen finden Sie unter Gewähren von Zugriffsberechtigungen für einen Benutzer oder eine Benutzergruppe in der Amazon Redshift Redshift-Dokumentation. | DBA |
Wenden Sie die Konfigurationseinstellungen auf die Zieldatenbank an. | Wenden Sie die Konfigurationseinstellungen entsprechend Ihren Anforderungen auf die Amazon Redshift Redshift-Datenbank an. Weitere Informationen zur Aktivierung von Parametern auf Datenbank-, Sitzungs- und Serverebene finden Sie in der Konfigurationsreferenz in der Amazon Redshift Redshift-Dokumentation. | DBA |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Manuelles Erstellen von Tabellen DDL in Amazon Redshift. | (Optional) Wenn Sie dies verwenden AWSSCT, werden die Tabellen automatisch erstellt. Wenn bei der Replikation jedoch Fehler auftretenDDLs, müssen Sie die Tabellen manuell erstellen | DBA |
Erstellen Sie externe Tabellen für Redshift Spectrum. | Erstellen Sie eine externe Tabelle mit einem externen Schema für Amazon Redshift Spectrum. Um externe Tabellen zu erstellen, müssen Sie der Eigentümer des externen Schemas oder ein Datenbank-Superuser sein. Weitere Informationen finden Sie unter Erstellen externer Tabellen für Amazon Redshift Spectrum in der Amazon Redshift-Dokumentation. | DBA |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Wird verwendet AWSDMS, um die Daten zu migrieren. | Nachdem Sie die Tabellen in DDL der Amazon Redshift-Datenbank erstellt haben, migrieren Sie Ihre Daten zu Amazon Redshift mithilfe von. AWS DMS Ausführliche Schritte und Anweisungen finden Sie in der AWS DMS Dokumentation unter Verwenden einer Amazon Redshift Redshift-Datenbank als Ziel für AWS DMS. | DBA |
Verwenden Sie den COPY Befehl, um die Daten zu laden. | Verwenden Sie den Amazon Weitere Informationen finden Sie unter Verwenden des COPY Befehls zum Laden aus Amazon S3 in der Amazon Redshift Redshift-Dokumentation. | DBA |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Validieren Sie die Quell- und Zieldatensätze. | Überprüfen Sie die Tabellenanzahl für die Quell- und Zieldatensätze, die aus Ihrem Quellsystem geladen wurden. | DBA |
Implementieren Sie die Best Practices von Amazon Redshift zur Leistungsoptimierung. | Implementieren Sie die Best Practices von Amazon Redshift für das Tabellen- und Datenbankdesign. Weitere Informationen finden Sie im Blogbeitrag Die 10 wichtigsten Techniken zur Leistungsoptimierung für Amazon Redshift | DBA |
Optimieren Sie die Abfrageleistung. | Amazon Redshift verwendet SQL basierte Abfragen, um mit Daten und Objekten im System zu interagieren. Die Datenmanipulationssprache (DML) ist die TeilmengeSQL, mit der Sie Daten anzeigen, hinzufügen, ändern und löschen können. DDList die TeilmengeSQL, die Sie zum Hinzufügen, Ändern und Löschen von Datenbankobjekten wie Tabellen und Ansichten verwenden. Weitere Informationen finden Sie unter Optimieren der Abfrageleistung in der Amazon Redshift Redshift-Dokumentation. | DBA |
ImplementierenWLM. | Sie können Workload Management (WLM) verwenden, um mehrere Abfragewarteschlangen zu definieren und Abfragen zur Laufzeit an die entsprechenden Warteschlangen weiterzuleiten. Weitere Informationen finden Sie unter Implementieren des Workload-Managements in der Amazon Redshift Redshift-Dokumentation. | DBA |
Arbeiten Sie mit Parallelitätsskalierung. | Mithilfe der Concurrency Scaling-Funktion können Sie praktisch unbegrenzt viele gleichzeitige Benutzer und Abfragen bei gleichbleibend schneller Abfrageleistung unterstützen. Weitere Informationen finden Sie unter Arbeiten mit Parallelitätsskalierung in der Amazon Redshift Redshift-Dokumentation. | DBA |
Verwenden Sie die Best Practices von Amazon Redshift für das Tabellendesign. | Bei der Planung Ihrer Datenbank können bestimmte wichtige Entscheidungen beim Tabellenentwurf die allgemeine Abfrageleistung stark beeinflussen. Weitere Informationen zur Auswahl der am besten geeigneten Tabellenentwurfsoption finden Sie unter Bewährte Methoden für das Entwerfen von Tabellen für Amazon Redshift in der Amazon Redshift-Dokumentation. | DBA |
Erstellen Sie materialisierte Ansichten in Amazon Redshift. | Eine materialisierte Ansicht enthält einen vorberechneten Ergebnissatz, der auf einer SQL Abfrage über eine oder mehrere Basistabellen basiert. Sie können Weitere Informationen finden Sie unter Erstellen materialisierter Ansichten in Amazon Redshift in der Amazon Redshift Redshift-Dokumentation. | DBA |
Definieren Sie Verknüpfungen zwischen den Tabellen. | Um in mehr als einer Tabelle gleichzeitig zu suchen ThoughtSpot, müssen Sie Verknüpfungen zwischen den Tabellen definieren, indem Sie Spalten angeben, die übereinstimmende Daten aus zwei Tabellen enthalten. Diese Spalten stellen das Sie können sie mit dem | DBA |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Fügen Sie eine Amazon Redshift Redshift-Verbindung hinzu. | Fügen Sie Ihrer lokalen ThoughtSpot Falcon-Datenbank eine Amazon Redshift Redshift-Verbindung hinzu. Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Hinzufügen einer Amazon Redshift Redshift-Verbindung | DBA |
Bearbeiten Sie die Amazon Redshift Redshift-Verbindung. | Sie können die Amazon Redshift Redshift-Verbindung bearbeiten, um Tabellen und Spalten hinzuzufügen. Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Bearbeiten einer Amazon Redshift Redshift-Verbindung | DBA |
Ordnen Sie die Amazon Redshift Redshift-Verbindung neu zu. | Ändern Sie die Verbindungsparameter, indem Sie die Quell-Mapping-.yaml-Datei bearbeiten, die beim Hinzufügen der Amazon Redshift Redshift-Verbindung erstellt wurde. Sie können beispielsweise die bestehende Tabelle oder Spalte einer anderen Tabelle oder Spalte in einer bestehenden Datenbankverbindung neu zuordnen. ThoughtSpot empfiehlt, die Abhängigkeiten vor und nach der Neuzuweisung einer Tabelle oder Spalte in einer Verbindung zu überprüfen, um sicherzustellen, dass sie wie gewünscht angezeigt werden. Weitere Informationen finden Sie in der Dokumentation unter Eine Amazon Redshift Redshift-Verbindung neu zuordnen | DBA |
Löschen Sie eine Tabelle aus der Amazon Redshift Redshift-Verbindung. | (Optional) Wenn Sie versuchen, eine Tabelle in einer Amazon Redshift Redshift-Verbindung zu entfernen, ThoughtSpot sucht es nach Abhängigkeiten und zeigt eine Liste der abhängigen Objekte an. Sie können die aufgelisteten Objekte auswählen, um sie zu löschen oder die Abhängigkeit zu entfernen. Anschließend können Sie die Tabelle entfernen. Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Löschen einer Tabelle aus einer Amazon Redshift Redshift-Verbindung | DBA |
Löschen Sie eine Tabelle mit abhängigen Objekten aus einer Amazon Redshift Redshift-Verbindung. | (Optional) Wenn Sie versuchen, eine Tabelle mit abhängigen Objekten zu löschen, wird der Vorgang blockiert. Ein Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Löschen einer Tabelle mit abhängigen Objekten aus einer Amazon Redshift Redshift-Verbindung | DBA |
Löschen Sie eine Amazon Redshift Redshift-Verbindung. | (Optional) Da eine Verbindung in mehreren Datenquellen oder Visualisierungen verwendet werden kann, müssen Sie alle Quellen und Aufgaben löschen, die diese Verbindung verwenden, bevor Sie die Amazon Redshift Redshift-Verbindung löschen können. Weitere Informationen finden Sie in der ThoughtSpot Dokumentation unter Löschen einer Amazon Redshift Redshift-Verbindung | DBA |
Überprüfen Sie die Verbindungsreferenz für Amazon Redshift. | Stellen Sie sicher, dass Sie die erforderlichen Informationen für Ihre Amazon Redshift Redshift-Verbindung angeben, indem Sie die Verbindungsreferenz | DBA |