Abfragen - Amazon Timestream

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Abfragen

Mit Timestream for Live Analytics können Sie auf einfache Weise Metriken für DevOps Sensordaten für IoT-Anwendungen und industrielle Telemetriedaten für die Gerätewartung sowie viele andere Anwendungsfälle speichern und analysieren. Die speziell entwickelte, adaptive Abfrage-Engine in Timestream for Live Analytics ermöglicht Ihnen den Zugriff auf Daten über mehrere Speicherstufen hinweg mit einer einzigen Anweisung. SQL Sie greift transparent auf Daten auf verschiedenen Speicherebenen zu und kombiniert sie, ohne dass Sie den Speicherort der Daten angeben müssen. Sie können SQL Daten in Timestream for Live Analytics abfragen, um Zeitreihendaten aus einer oder mehreren Tabellen abzurufen. Sie können auf die Metadateninformationen für Datenbanken und Tabellen zugreifen. Timestream for Live Analytics unterstützt SQL auch integrierte Funktionen für Zeitreihenanalysen. Weitere Informationen finden Sie in der Referenz zur Abfragesprache Referenz.

Timestream for Live Analytics ist so konzipiert, dass es über eine vollständig entkoppelte Architektur für Datenaufnahme, Speicherung und Abfrage verfügt, bei der jede Komponente unabhängig von anderen Komponenten skaliert werden kann (sodass sie praktisch unendlich skaliert werden kann, um den Anforderungen einer Anwendung gerecht zu werden). Das bedeutet, dass Timestream for Live Analytics nicht „umkippt“, wenn Ihre Anwendungen Hunderte von Terabyte an Daten pro Tag senden oder Millionen von Abfragen ausführen, die kleine oder große Datenmengen verarbeiten. Da Ihre Daten im Laufe der Zeit wachsen, bleibt die Abfragelatenz in Timestream for Live Analytics weitgehend unverändert. Dies liegt daran, dass die Timestream for Live Analytics-Abfragearchitektur enorme Mengen an Parallelität nutzen kann, um größere Datenmengen zu verarbeiten und automatisch zu skalieren, um den Anforderungen einer Anwendung an den Abfragedurchsatz gerecht zu werden.

Datenmodell

Timestream unterstützt zwei Datenmodelle für Abfragen: das flache Modell und das Zeitreihenmodell.

Anmerkung

Daten in Timestream werden mithilfe des flachen Modells gespeichert und es ist das Standardmodell für die Abfrage von Daten. Das Zeitreihenmodell ist ein Abfragezeitkonzept und wird für Zeitreihenanalysen verwendet.

Flaches Modell

Das flache Modell ist das Standarddatenmodell von Timestream für Abfragen. Es stellt Zeitreihendaten in einem tabellarischen Format dar. Die Dimensionsnamen, die Zeit, die Kennzahlnamen und die Kennzahlwerte werden als Spalten angezeigt. Jede Zeile in der Tabelle ist ein atomarer Datenpunkt, der einer Messung zu einem bestimmten Zeitpunkt innerhalb einer Zeitreihe entspricht. Für Timestream-Datenbanken, -Tabellen und -Spalten gelten einige Einschränkungen bei der Benennung. Diese werden unter beschrieben. Service Limits

Die folgende Tabelle zeigt ein anschauliches Beispiel dafür, wie Timestream Daten speichert, die die CPU Auslastung, Speicherauslastung und Netzwerkaktivität von EC2 Instances darstellen, wenn die Daten als Einzeldatensatz gesendet werden. In diesem Fall handelt es sich bei den Dimensionen um die Region, die Verfügbarkeitszone, die virtuelle private Cloud und die Instanz IDs der Instanzen. EC2 Bei den Kennzahlen handelt es sich um die CPU Auslastung, die Speicherauslastung und die eingehenden Netzwerkdaten für die EC2 Instanzen. Die Spalten region, az, vpc und instance_id enthalten die Dimensionswerte. Die Spalte time enthält den Zeitstempel für jeden Datensatz. Die Spalte measure_name enthält die Namen der Kennzahlen, die durch cpu-utilization, memory_utilization und network_bytes_in dargestellt werden. Die Spalten measure_value: :double enthalten Messwerte, die doppelt ausgegeben werden (z. B. Auslastung und Speicherauslastung). CPU Die Spalte measure_value: :bigint enthält Messungen, die als ganze Zahlen ausgegeben werden, z. B. die eingehenden Netzwerkdaten.

Zeit Region az vpc instance_id measure_name Messwert::doppelt Messwert::bigint

2019-12-04 19:00:00.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

CPU-Auslastung

35,0

Null

2019-12-04 19:00:01.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

CPU-Auslastung

38,2

Null

2019-12-04 19:00:02.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

CPU-Auslastung

45,3

Null

2019-12-04 19:00:00.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

54,9

Null

2019-12-04 19:00:01.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

42,6

Null

2019-12-04 19:00:02.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

33,3

Null

2019-12-04 19:00:00.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

Netzwerk-Bytes

34.400

Null

2019-12-04 19:00:01.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

Netzwerk-Bytes

1.500

Null

2019-12-04 19:00:02.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

Netzwerk-Bytes

6 000

Null

Die folgende Tabelle zeigt ein anschauliches Beispiel dafür, wie Timestream Daten speichert, die die CPU Auslastung, Speicherauslastung und Netzwerkaktivität von EC2 Instances darstellen, wenn die Daten als Datensatz mit mehreren Messwerten gesendet werden.

Zeit Region az vpc instance_id measure_name cpu_utilization memory_utilization Netzwerk-Bytes

2019-12-04 19:00:00.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

Kennzahlen

35,0

54,9

34.400

2019-12-04 19:00:01.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

Kennzahlen

38,2

42,6

1.500

2019-12-04 19:00:02.000 000000

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

Kennzahlen

45,3

33,3

6.600

Zeitreihenmodell

Das Zeitreihenmodell ist ein Abfragezeitkonstrukt, das für Zeitreihenanalysen verwendet wird. Es stellt Daten als eine geordnete Folge von Paaren (Zeit, Messwert) dar. Timestream unterstützt Zeitreihenfunktionen wie Interpolation, damit Sie die Lücken in Ihren Daten schließen können. Um diese Funktionen verwenden zu können, müssen Sie Ihre Daten mithilfe von Funktionen wie create_time_series in das Zeitreihenmodell konvertieren. Weitere Einzelheiten finden Sie unter. Referenz zur Abfragesprache

Anhand des vorherigen Beispiels der EC2 Instanz werden hier die CPU Nutzungsdaten als Zeitreihe ausgedrückt.

Region az vpc instance_id cpu_utilization

us-east-1

us-ost-1d

vpc-1a2b3c4d

i-1234567890abcdef0

[{Zeit: 2019-12-04 19:00:00.000 000000, Wert: 35}, {Zeit: 2019-12-04 19:00:01.000 000000, Wert: 38,2}, {Zeit: 2019-12-04 19:00:02.000 000000, Wert: 45,3}]