Amazon Managed Service für Apache Flink war zuvor als Amazon Kinesis Data Analytics für Apache Flink bekannt.
Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Tabelleneigenschaften
Zusätzlich zu den Datenfeldern stellen Ihre AWS Glue Tabellen mithilfe von Tabelleneigenschaften weitere Informationen für Ihr Studio-Notizbuch bereit. Managed Service für Apache Flink verwendet die folgenden AWS Glue Tabelleneigenschaften:
Definieren Sie Apache Flink-Zeitwerte: Diese Eigenschaften definieren, wie Managed Service für Apache Flink interne Datenverarbeitungszeitwerte von Apache Flink ausgibt.
Verwenden Sie den Flink-Anschluss und die Formateigenschaften: Diese Eigenschaften liefern Informationen über Ihre Datenströme.
Gehen Sie wie folgt vor, um einer AWS Glue Tabelle eine Eigenschaft hinzuzufügen:
Melden Sie sich bei der an AWS Management Console und öffnen Sie die AWS Glue Konsole unter https://console.aws.amazon.com/glue/
. Wählen Sie aus der Tabellenliste die Tabelle aus, die Ihre Anwendung zum Speichern von Datenverbindungsinformationen verwendet. Wählen Sie Aktion, Tabellendetails bearbeiten aus.
Geben Sie unter Tabelleneigenschaften den Wert
managed-flink.proctime
für Schlüssel unduser_action_time
für Wert ein.
Definieren Sie Apache Flink-Zeitwerte
Apache Flink stellt Zeitwerte bereit, die beschreiben, wann Ereignisse bei der Stream-Verarbeitung aufgetreten sind, z. B. Verarbeitungszeit
Die Schlüssel und Werte, die Sie in Ihren Tabelleneigenschaften verwenden, lauten wie folgt:
Zeitstempeltyp | Schlüssel | Wert |
---|---|---|
Dauer der Verarbeitung |
managed-flink.proctime | Der Spaltenname, der verwendet AWS Glue wird, um den Wert verfügbar zu machen. Dieser Spaltenname entspricht keiner vorhandenen Tabellenspalte. |
Zeit des Ereignisses |
managed-flink.rowtime | Der Spaltenname, der verwendet AWS Glue wird, um den Wert verfügbar zu machen. Dieser Spaltenname entspricht einer vorhandenen Tabellenspalte. |
managed-flink.watermark. |
Das Wasserzeichenintervall in Millisekunden |
Verwenden Sie den Flink-Anschluss und die Formateigenschaften
Mithilfe von AWS Glue -Tabelleneigenschaften stellen Sie den Flink-Konnektoren Ihrer Anwendung Informationen über Ihre Datenquellen zur Verfügung. Im Folgenden einige Beispiele für die Eigenschaften, die Managed Service für Apache Flink für Konnektoren verwendet:
Konnektortyp | Schlüssel | Wert |
---|---|---|
Kafka |
format |
Das Format, das zur Deserialisierung und Serialisierung von Kafka-Nachrichten verwendet wird, z. B. oder. json csv |
scan.startup.mode |
Der Startmodus für den Kafka-Verbraucher, z. B. oder. earliest-offset timestamp |
|
Kinesis |
format |
Das Format, das zum Deserialisieren und Serialisieren von Kinesis-Datenstream-Datensätzen verwendet wird, z. B. oder. json csv |
aws.region |
Die AWS Region, in der der Stream definiert ist. | |
S3 (Dateisystem) |
Format | Das Format, das zum Deserialisieren und Serialisieren von Dateien verwendet wird, z. B. oder. json csv |
path |
Der Amazon S3 S3-Pfad, z. s3://mybucket/ B. |
Weitere Informationen zu anderen Konnektoren neben Kinesis und Apache Kafka finden Sie in der Dokumentation Ihres Konnektors.