Tutorial: Daten in Amazon Keyspaces laden mit DSBulk - Amazon Keyspaces (für Apache Cassandra)

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Tutorial: Daten in Amazon Keyspaces laden mit DSBulk

Dieses step-by-step Tutorial führt Sie durch die Migration von Daten von Apache Cassandra zu Amazon Keyspaces mithilfe des DataStax Bulk Loaders (DSBulk), der auf verfügbar ist. GitHub DSBulkDie Verwendung ist nützlich, um Datensätze für akademische Zwecke oder Testzwecke auf Amazon Keyspaces hochzuladen. Weitere Informationen zur Migration von Produktionsworkloads finden Sie unter. Offline-Migrationsprozess: Apache Cassandra zu Amazon Keyspaces In diesem Tutorial führen Sie die folgenden Schritte aus.

Voraussetzungen — Richten Sie eine ein AWS Konto mit Anmeldeinformationen, Erstellung einer JKS Trust-Store-Datei für das Zertifikatcqlsh, Konfiguration, Download und Installation DSBulk sowie Konfiguration einer application.conf Datei.

  1. Quell CSV - und Zieltabelle erstellen — Bereiten Sie eine CSV Datei als Quelldaten vor und erstellen Sie den Zielschlüsselraum und die Zieltabelle in Amazon Keyspaces.

  2. Daten vorbereiten — Randomisieren Sie die Daten in der CSV Datei und analysieren Sie sie, um die durchschnittliche und maximale Zeilengröße zu ermitteln.

  3. Durchsatzkapazität festlegen — Berechnen Sie die erforderlichen Schreibkapazitätseinheiten (WCUs) auf der Grundlage der Datengröße und der gewünschten Ladezeit und konfigurieren Sie die bereitgestellte Kapazität der Tabelle.

  4. DSBulkEinstellungen konfigurieren — Erstellen Sie eine DSBulk Konfigurationsdatei mit Einstellungen wie Authentifizierung,SSL/TLS, Konsistenzstufe und Größe des Verbindungspools.

  5. Den DSBulk Ladebefehl ausführen — Führen Sie den Befehl DSBulk load aus, um die Daten aus der CSV Datei in die Amazon Keyspaces-Tabelle hochzuladen und den Fortschritt zu überwachen.