Arbeiten mit dem Schema-Editor - Entwicklerhandbuch für Amazon Kinesis Data Analytics for SQL Applications

Nach reiflicher Überlegung haben wir beschlossen, Amazon Kinesis Data Analytics für SQL Anwendungen in zwei Schritten einzustellen:

1. Ab dem 15. Oktober 2025 können Sie keine neuen Kinesis Data Analytics für SQL Anwendungen erstellen.

2. Wir werden Ihre Anwendungen ab dem 27. Januar 2026 löschen. Sie können Ihre Amazon Kinesis Data Analytics for SQL Applications weder starten noch betreiben. SQLAb diesem Zeitpunkt ist kein Support mehr für Amazon Kinesis Data Analytics verfügbar. Weitere Informationen finden Sie unter Einstellung von Amazon Kinesis Data Analytics for SQL Applications.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Arbeiten mit dem Schema-Editor

Das Schema für den Eingabestream einer Amazon Kinesis Data Analytics Analytics-Anwendung definiert, wie Daten aus dem Stream für SQL Abfragen in der Anwendung verfügbar gemacht werden.

Diagramm, das die Beziehung zwischen Streaming-Eingabe, Quell-Schema-Konfiguration und In-Application-Eingabe-Streams aufzeigt

Das Schema enthält Auswahlkriterien, mit denen Sie festlegen können, welcher Teil der Streaming-Eingabe im In-Application-Eingabe-Stream in eine Datenspalte umgewandelt wird. Bei dieser Eingabe kann es sich Folgendes handeln:

  • Ein JSONPath Ausdruck für JSON Eingabe-Streams. JSONPathist ein Tool zum Abfragen von JSON Daten.

  • Eine Spaltennummer für Eingabestreams im Format mit kommagetrennten Werten ()CSV.

  • Ein Spaltenname und ein SQL Datentyp für die Darstellung der Daten im anwendungsinternen Datenstrom. Der Datentyp enthält auch eine Länge für Zeichen oder Binärdaten.

Die Konsole versucht, das Schema mittels DiscoverInputSchema zu generieren. Wenn eine Schemaerkennung fehlschlägt oder ein falsches oder unvollständiges Schema zurückgegeben wird, müssen Sie das Schema mit dem Schema-Editor manuell bearbeiten.

Hauptbildschirm des Schema-Editors

Der folgende Screenshot zeigt den Hauptbildschirm des Schema-Editors.

Screenshot der Seite "Edit schema (Schema bearbeiten)"

Sie können die folgenden Bearbeitungen auf das Schema anwenden:

  • Hinzufügen einer Spalte (1): Möglicherweise müssen Sie eine Datenspalte hinzufügen, wenn ein Datenelement nicht automatisch erkannt wird.

  • Löschen einer Spalte (2): Sie können Daten aus dem Quell-Stream ausschließen, wenn Ihre Anwendung diese nicht benötigt. Dieser Ausschluss wirkt sich nicht auf die Daten im Quell-Stream aus. Wenn Daten ausgeschlossen werden, werden sie der Anwendung einfach nicht zur Verfügung gestellt.

  • Umbenennen einer Spalte (3): Ein Spaltenname darf nicht leer sein, muss länger als ein einzelnes Zeichen sein und darf keine reservierten SQL Schlüsselwörter enthalten. Der Name muss auch die Benennungskriterien für SQL normale Bezeichner erfüllen: Der Name muss mit einem Buchstaben beginnen und darf nur Buchstaben, Unterstriche und Ziffern enthalten.

  • Ändern des Datentyps (4) oder der Länge (5) einer Spalte: Sie können einen kompatiblen Datentyp für eine Spalte angeben. Wenn Sie einen inkompatiblen Datentyp angeben, wird die Spalte entweder mit aufgefüllt NULL oder der In-Application-Stream wird überhaupt nicht gefüllt. In letzteren Fall werden Fehler in den Fehler-Stream geschrieben. Wenn Sie eine Länge für eine Spalte angeben, die zu klein ist, werden die eingehenden Daten abgeschnitten.

  • Ändern Sie die Auswahlkriterien einer Spalte (6): Sie können den JSONPath Ausdruck oder die CSV Spaltenreihenfolge bearbeiten, anhand derer die Quelle der Daten in einer Spalte bestimmt wird. Um die Auswahlkriterien für ein JSON Schema zu ändern, geben Sie einen neuen Wert für den Zeilenpfadausdruck ein. Ein CSV Schema verwendet die Spaltenreihenfolge als Auswahlkriterium. Um die Auswahlkriterien für ein CSV Schema zu ändern, ändern Sie die Reihenfolge der Spalten.

Bearbeiten des Schemas für eine Streaming-Quelle

Wenn Sie ein Schema für eine Streaming-Quelle bearbeiten müssen, führen Sie die folgenden Schritte aus.

So bearbeiten Sie das Schema für eine Streaming-Quelle
  1. Wählen Sie auf der Seite Source die Option Edit schema.

    Screenshot der formatierten Stream-Beispiel-Registerkarte mit Bestandsdaten und hervorgehobener Schaltfläche "Edit schema (Schema bearbeiten)".
  2. Bearbeiten Sie auf der Seite Edit schema das Quell-Schema.

    Screenshot der Seite "Edit schema (Schema bearbeiten)"
  3. Wählen Sie als Format JSONoder aus CSV. Für CSV das Format JSON oder ist die unterstützte Kodierung ISO 8859-1.

Weitere Informationen zur Bearbeitung des Schemas für JSON oder das CSV Format finden Sie in den Verfahren in den nächsten Abschnitten.

Ein JSON Schema bearbeiten

Sie können ein JSON Schema bearbeiten, indem Sie die folgenden Schritte ausführen.

Um ein JSON Schema zu bearbeiten
  1. Wählen Sie im Schema-Editor Add column, um eine Spalte hinzuzufügen.

    In der ersten Spaltenposition wird eine neue Spalte angezeigt. Zum Ändern der Spaltenreihenfolge wählen Sie die nach oben und unten zeigenden Pfeile neben dem Spaltennamen.

    Geben Sie für neue Spalte folgende Informationen an:

    • Geben Sie in Column name einen Namen ein.

      Ein Spaltenname darf nicht leer sein, muss länger als ein einzelnes Zeichen sein und darf keine reservierten SQL Schlüsselwörter enthalten. Er muss auch die Benennungskriterien für SQL normale Bezeichner erfüllen: Er muss mit einem Buchstaben beginnen und darf nur Buchstaben, Unterstriche und Ziffern enthalten.

    • Geben Sie für Spaltentyp einen SQL Datentyp ein.

      Ein Spaltentyp kann ein beliebiger unterstützter SQL Datentyp sein. Wenn der neue DatentypCHAR,, oder ist VARBINARYVARCHAR, geben Sie eine Datenlänge für Länge an. Weitere Informationen finden Sie unter Data Types.

    • Geben Sie für Row path einen Zeilenpfad an. Ein Zeilenpfad ist ein gültiger JSONPath Ausdruck, der einem JSON Element zugeordnet ist.

      Anmerkung

      Der Basiswert für Row path ist der Pfad zum übergeordneten Element auf höchster Ebene, das die zu importierenden Daten enthält. Dieser Wert ist standardmäßig $. Weitere Informationen finden Sie unter RecordRowPath in JSONMappingParameters.

  2. Um eine Spalte zu löschen, wählen Sie das Symbol x neben der Spaltennummer.

    Screenshot des Schema-Editors mit dem Symbol x neben der Spaltennummer.
  3. Geben Sie unter Column name (Spaltenname) einen neuen Namen für eine Spalte ein, um diese umzubenennen. Der neue Spaltenname darf nicht leer sein, muss länger als ein einzelnes Zeichen sein und darf keine reservierten SQL Schlüsselwörter enthalten. Er muss auch die Benennungskriterien für SQL normale Bezeichner erfüllen: Er muss mit einem Buchstaben beginnen und darf nur Buchstaben, Unterstriche und Ziffern enthalten.

  4. Um den Datentyp einer Spalte zu ändern, wählen Sie für Column type einen neuen Datentyp aus. Handelt es sich beim neuen Datentyp um CHAR, VARBINARY oder VARCHAR, geben Sie unter Length (Länge) eine Datenlänge ein. Weitere Informationen finden Sie unter Data Types.

  5. Wählen Sie Save schema and update stream, um Ihre Änderungen zu speichern.

Das geänderte Schema wird im Editor angezeigt und sieht ähnlich dem folgenden Schema aus.

Screenshot des Schema-Editors mit dem modifizierten Schema.

Wenn Ihr Schema zahlreiche Zeilen besitzt, können Sie die Zeilen mittels Filter by column name filtern. Um beispielsweise Spaltennamen zu bearbeiten, die mit P beginnen, wie eine Price-Spalte, geben Sie P im Feld Nach Spaltennamen filtern ein.

Ein Schema bearbeiten CSV

Sie können ein CSV Schema bearbeiten, indem Sie die folgenden Schritte ausführen.

Um ein CSV Schema zu bearbeiten
  1. Wählen Sie im Schema-Editor für Row delimiter das Trennzeichen aus, das im eingehenden Daten-Stream verwendet wird. Dies ist das Trennzeichen zwischen Datensätzen von Daten in Ihrem Stream, z. B. ein Zeilenumbruchzeichen.

  2. Wählen Sie für Column delimiter das Trennzeichen aus, das im eingehenden Daten-Stream verwendet wird. Dies ist das Trennzeichen zwischen Feldern von Daten in Ihrem Stream, z. B. ein Komma.

  3. Um eine Spalte hinzuzufügen, wählen Sie Add column.

    In der ersten Spaltenposition wird eine neue Spalte angezeigt. Zum Ändern der Spaltenreihenfolge wählen Sie die nach oben und unten zeigenden Pfeile neben dem Spaltennamen.

    Geben Sie für neue Spalte folgende Informationen an:

    • Geben Sie unter Column name (Spaltenname) einen Namen ein.

      Ein Spaltenname darf nicht leer sein, muss länger als ein einzelnes Zeichen sein und darf keine reservierten SQL Schlüsselwörter enthalten. Er muss auch die Benennungskriterien für SQL normale Bezeichner erfüllen: Er muss mit einem Buchstaben beginnen und darf nur Buchstaben, Unterstriche und Ziffern enthalten.

    • Geben Sie für Spaltentyp einen SQL Datentyp ein.

      Ein Spaltentyp kann ein beliebiger unterstützter SQL Datentyp sein. Wenn der neue DatentypCHAR,, oder ist VARBINARYVARCHAR, geben Sie eine Datenlänge für Länge an. Weitere Informationen finden Sie unter Data Types.

  4. Um eine Spalte zu löschen, wählen Sie das Symbol x neben der Spaltennummer.

    Screenshot des Schema-Editors mit dem Symbol x neben der Spaltennummer.
  5. Geben Sie unter Column name (Spaltenname) einen neuen Namen für eine Spalte ein, um diese umzubenennen. Der neue Spaltenname darf nicht leer sein, muss länger als ein einzelnes Zeichen sein und darf keine reservierten SQL Schlüsselwörter enthalten. Er muss auch die Benennungskriterien für SQL normale Bezeichner erfüllen: Er muss mit einem Buchstaben beginnen und darf nur Buchstaben, Unterstriche und Ziffern enthalten.

  6. Um den Datentyp einer Spalte zu ändern, wählen Sie für Column type einen neuen Datentyp aus. Wenn der neue Datentyp,, oder ist CHAR VARBINARYVARCHAR, geben Sie eine Datenlänge für Länge an. Weitere Informationen finden Sie unter Data Types.

  7. Wählen Sie Save schema and update stream, um Ihre Änderungen zu speichern.

Das geänderte Schema wird im Editor angezeigt und sieht ähnlich dem folgenden Schema aus.

Screenshot des Schema-Editors mit dem modifizierten Schema.

Wenn Ihr Schema zahlreiche Zeilen besitzt, können Sie die Zeilen mittels Filter by column name filtern. Um beispielsweise Spaltennamen zu bearbeiten, die mit P beginnen, wie eine Price-Spalte, geben Sie P im Feld Nach Spaltennamen filtern ein.