Benennung von Spalten während der Schemaerkennung Probleme bei der Schemaerkennung

Nach reiflicher Überlegung haben wir uns entschieden, Amazon Kinesis Data Analytics für SQL-Anwendungen einzustellen:

1. Ab dem 1. September 2025 werden wir keine Bugfixes für Amazon Kinesis Data Analytics for SQL-Anwendungen bereitstellen, da wir aufgrund der bevorstehenden Einstellung nur eingeschränkten Support dafür haben werden.

2. Ab dem 15. Oktober 2025 können Sie keine neuen Kinesis Data Analytics for SQL-Anwendungen mehr erstellen.

3. Wir werden Ihre Anwendungen ab dem 27. Januar 2026 löschen. Sie können Ihre Amazon Kinesis Data Analytics for SQL-Anwendungen nicht starten oder betreiben. Ab diesem Zeitpunkt ist kein Support mehr für Amazon Kinesis Data Analytics for SQL verfügbar. Weitere Informationen finden Sie unter Einstellung von Amazon Kinesis Data Analytics für SQL-Anwendungen.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden der Funktion der Schemaerkennung für Streaming-Daten

Anmerkung

Nach dem 12. September 2023 können Sie keine neuen Anwendungen mit Kinesis Data Firehose als Quelle erstellen, wenn Sie nicht bereits Kinesis Data Analytics for SQL. Weitere Informationen finden Sie unter Limits.

Die Bereitstellung eines Eingabeschemas, das beschreibt, wie Datensätze im Streaming-Eingabestream einem anwendungsinternen Stream zugeordnet werden, kann umständlich und fehleranfällig sein. Sie können die DiscoverInputSchema-API (Erkennungs-API genannt), um ein Schema abzuleiten. Aus Zufallsstichproben von Datensätzen in der Streaming-Quelle kann die API ein Schema ableiten (d. h. Spaltennamen, Datentypen und Position des Datenelements in den eingehenden Daten).

Anmerkung

Informationen zum Verwenden der Discovery-API zum Erstellen eines Schemas aus einer in Amazon-S3 gespeicherten Datei finden Sie unter Verwenden der Funktion der Schemaerkennung für statische Daten.

Die Konsole verwendet die Discovery-API, um ein Schema für eine angegebene Streaming-Quelle zu generieren. Mithilfe der Konsole können Sie das Schema auch aktualisieren, z. B. Spalten hinzufügen oder entfernen, Spaltennamen oder Datentypen ändern usw. Gehen Sie bei den Änderungen jedoch sorgfältig vor, um sicherzustellen, dass Sie kein ungültiges Schema erstellen.

Nachdem Sie ein Schema für Ihren In-Application-Stream fertiggestellt haben, gibt es Funktionen, die Sie zur Bearbeitung von Zeichenfolgen- und Datums-/Uhrzeitwerten verwenden können. Sie können diese Funktionen in Ihrem Anwendungscode verwenden, wenn Sie im resultierenden In-Application-Stream mit Zeilen arbeiten. Weitere Informationen finden Sie unter Beispiel: Werte transformieren DateTime.

Benennung von Spalten während der Schemaerkennung

Während der Schemaerkennung versucht Amazon-Kinesis-Data-Analytics einen möglichst großen Teil des ursprünglichen Spaltennamens aus der Streaming-Eingabequelle beizubehalten, außer in folgenden Fällen:

Der Spaltenname der Quelle ist ein reserviertes SQL-Schlüsselwort wie TIMESTAMP, USER, VALUES oder YEAR.
Der Spaltenname des Quell-Streams enthält nicht unterstützte Zeichen. Es werden nur Buchstaben, Ziffern und Unterstriche (_) unterstützt.
Die Spaltenname des Quell-Streams beginnt mit einer Zahl.
Der Spaltenname des Quell-Streams enthält mehr als 100 Zeichen.

Wenn eine Spalte umbenannt wird, beginnt der umbenannte Spaltenname mit COL_. In einigen Fällen können keine der ursprünglichen Spaltennamen beibehalten werden, beispielsweise wenn der gesamte Name aus nicht unterstützten Zeichen besteht. In einem solchen Fall wird die Spalte mit COL_# benannt, wobei # eine Zahl ist, die den Platz der Spalte in der Spaltenreihenfolge angibt.

Nach dem Abschluss der Erkennung können Sie das Schema über die Konsole aktualisieren, um Spalten hinzuzufügen oder zu entfernen oder um Spaltennamen, Datentypen oder Datengröße zu ändern.

Beispiele für während der Erkennung vorgeschlagene Spaltennamen

Spaltenname im Quell-Stream	Während der Erkennung vorgeschlagener Spaltenname
USER	COL_USER
USER@DOMAIN	COL_USERDOMAIN
@@	COL_0

Probleme bei der Schemaerkennung

Was geschieht, wenn Kinesis Data Analytics kein Schema für eine bestimmte Streaming-Quelle ableitet?

Kinesis Data Analytics leitet Ihr Schema für gängige Formate wie CSV und JSON ab, die UTF-8 kodiert sind. Kinesis Data Analytics unterstützt alle mit UTF-8 kodierten Datensätze (einschließlich Rohtexte wie Anwendungsprotokolle und Datensätze) mit einem benutzerdefinierten Spalten- und Zeilentrennzeichen. Wenn Kinesis Data Analytics kein Schema ableitet, können Sie ein Schema manuell mittels des Schema-Editors in der Konsole (oder über die API) definieren.

Wenn Ihre Daten keinem Muster folgen (das Sie mittels des Schema-Editors angeben können), können Sie ein Schema als einzelne Spalte vom Typ VARCHAR(N) definieren, wobei N die größte Anzahl von Zeichen ist, die Ihr Datensatz voraussichtlich enthalten wird. Anschließend können Sie die Zeichenfolgen- und Datum-/Uhrzeitbearbeitung verwenden, um Ihre Daten zu strukturieren, wenn sie sich in einem In-Application-Stream befinden. Beispiele finden Sie unter Beispiel: Werte transformieren DateTime.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Zuweisung von Streaming-Quellenelementen zu SQL-Eingabespalten

Verwenden der Funktion der Schemaerkennung für statische Daten