Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Abfragen
Mit Timestream for Live Analytics können Sie auf einfache Weise Metriken für DevOps Sensordaten für IoT-Anwendungen und industrielle Telemetriedaten für die Gerätewartung sowie viele andere Anwendungsfälle speichern und analysieren. Die speziell entwickelte, adaptive Abfrage-Engine in Timestream for Live Analytics ermöglicht Ihnen den Zugriff auf Daten über mehrere Speicherstufen hinweg mit einer einzigen Anweisung. SQL Sie greift transparent auf Daten auf verschiedenen Speicherebenen zu und kombiniert sie, ohne dass Sie den Speicherort der Daten angeben müssen. Sie können SQL Daten in Timestream for Live Analytics abfragen, um Zeitreihendaten aus einer oder mehreren Tabellen abzurufen. Sie können auf die Metadateninformationen für Datenbanken und Tabellen zugreifen. Timestream for Live Analytics unterstützt SQL auch integrierte Funktionen für Zeitreihenanalysen. Weitere Informationen finden Sie in der Referenz zur Abfragesprache Referenz.
Timestream for Live Analytics ist so konzipiert, dass es über eine vollständig entkoppelte Architektur für Datenaufnahme, Speicherung und Abfrage verfügt, bei der jede Komponente unabhängig von anderen Komponenten skaliert werden kann (sodass sie praktisch unendlich skaliert werden kann, um den Anforderungen einer Anwendung gerecht zu werden). Das bedeutet, dass Timestream for Live Analytics nicht „umkippt“, wenn Ihre Anwendungen Hunderte von Terabyte an Daten pro Tag senden oder Millionen von Abfragen ausführen, die kleine oder große Datenmengen verarbeiten. Da Ihre Daten im Laufe der Zeit wachsen, bleibt die Abfragelatenz in Timestream for Live Analytics weitgehend unverändert. Dies liegt daran, dass die Timestream for Live Analytics-Abfragearchitektur enorme Mengen an Parallelität nutzen kann, um größere Datenmengen zu verarbeiten und automatisch zu skalieren, um den Anforderungen einer Anwendung an den Abfragedurchsatz gerecht zu werden.
Datenmodell
Timestream unterstützt zwei Datenmodelle für Abfragen: das flache Modell und das Zeitreihenmodell.
Anmerkung
Daten in Timestream werden mithilfe des flachen Modells gespeichert und es ist das Standardmodell für die Abfrage von Daten. Das Zeitreihenmodell ist ein Abfragezeitkonzept und wird für Zeitreihenanalysen verwendet.
Flaches Modell
Das flache Modell ist das Standarddatenmodell von Timestream für Abfragen. Es stellt Zeitreihendaten in einem tabellarischen Format dar. Die Dimensionsnamen, die Zeit, die Kennzahlnamen und die Kennzahlwerte werden als Spalten angezeigt. Jede Zeile in der Tabelle ist ein atomarer Datenpunkt, der einer Messung zu einem bestimmten Zeitpunkt innerhalb einer Zeitreihe entspricht. Für Timestream-Datenbanken, -Tabellen und -Spalten gelten einige Einschränkungen bei der Benennung. Diese werden unter beschrieben. Service Limits
Die folgende Tabelle zeigt ein anschauliches Beispiel dafür, wie Timestream Daten speichert, die die CPU Auslastung, Speicherauslastung und Netzwerkaktivität von EC2 Instances darstellen, wenn die Daten als Einzeldatensatz gesendet werden. In diesem Fall handelt es sich bei den Dimensionen um die Region, die Verfügbarkeitszone, die virtuelle private Cloud und die Instanz IDs der Instanzen. EC2 Bei den Kennzahlen handelt es sich um die CPU Auslastung, die Speicherauslastung und die eingehenden Netzwerkdaten für die EC2 Instanzen. Die Spalten region, az, vpc und instance_id enthalten die Dimensionswerte. Die Spalte time enthält den Zeitstempel für jeden Datensatz. Die Spalte measure_name enthält die Namen der Kennzahlen, die durch cpu-utilization, memory_utilization und network_bytes_in dargestellt werden. Die Spalten measure_value: :double enthalten Messwerte, die doppelt ausgegeben werden (z. B. Auslastung und Speicherauslastung). CPU Die Spalte measure_value: :bigint enthält Messungen, die als ganze Zahlen ausgegeben werden, z. B. die eingehenden Netzwerkdaten.
Zeit | Region | az | vpc | instance_id | measure_name | Messwert::doppelt | Messwert::bigint |
---|---|---|---|---|---|---|---|
2019-12-04 19:00:00.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
CPU-Auslastung |
35,0 |
Null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
CPU-Auslastung |
38,2 |
Null |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
CPU-Auslastung |
45,3 |
Null |
2019-12-04 19:00:00.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
54,9 |
Null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
42,6 |
Null |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
33,3 |
Null |
2019-12-04 19:00:00.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
Netzwerk-Bytes |
34.400 |
Null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
Netzwerk-Bytes |
1.500 |
Null |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
Netzwerk-Bytes |
6 000 |
Null |
Die folgende Tabelle zeigt ein anschauliches Beispiel dafür, wie Timestream Daten speichert, die die CPU Auslastung, Speicherauslastung und Netzwerkaktivität von EC2 Instances darstellen, wenn die Daten als Datensatz mit mehreren Messwerten gesendet werden.
Zeit | Region | az | vpc | instance_id | measure_name | cpu_utilization | memory_utilization | Netzwerk-Bytes |
---|---|---|---|---|---|---|---|---|
2019-12-04 19:00:00.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
Kennzahlen |
35,0 |
54,9 |
34.400 |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
Kennzahlen |
38,2 |
42,6 |
1.500 |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
Kennzahlen |
45,3 |
33,3 |
6.600 |
Zeitreihenmodell
Das Zeitreihenmodell ist ein Abfragezeitkonstrukt, das für Zeitreihenanalysen verwendet wird. Es stellt Daten als eine geordnete Folge von Paaren (Zeit, Messwert) dar. Timestream unterstützt Zeitreihenfunktionen wie Interpolation, damit Sie die Lücken in Ihren Daten schließen können. Um diese Funktionen verwenden zu können, müssen Sie Ihre Daten mithilfe von Funktionen wie create_time_series in das Zeitreihenmodell konvertieren. Weitere Einzelheiten finden Sie unter. Referenz zur Abfragesprache
Anhand des vorherigen Beispiels der EC2 Instanz werden hier die CPU Nutzungsdaten als Zeitreihe ausgedrückt.
Region | az | vpc | instance_id | cpu_utilization |
---|---|---|---|---|
us-east-1 |
us-ost-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
[{Zeit: 2019-12-04 19:00:00.000 000000, Wert: 35}, {Zeit: 2019-12-04 19:00:01.000 000000, Wert: 38,2}, {Zeit: 2019-12-04 19:00:02.000 000000, Wert: 45,3}] |