Query

Con Timestream for Live Analytics, puoi archiviare e analizzare facilmente metriche DevOps, dati dei sensori per applicazioni IoT e dati di telemetria industriale per la manutenzione delle apparecchiature, oltre a molti altri casi d'uso. Il motore di query adattivo appositamente progettato in Timestream for Live Analytics consente di accedere ai dati su più livelli di archiviazione utilizzando una singola istruzione SQL. Accede e combina in modo trasparente i dati tra diversi livelli di storage senza che sia necessario specificare la posizione dei dati. Puoi usare SQL per interrogare i dati in Timestream for Live Analytics per recuperare i dati delle serie temporali da una o più tabelle. È possibile accedere alle informazioni sui metadati per database e tabelle. Timestream for Live Analytics SQL supporta anche funzioni integrate per l'analisi delle serie temporali. Puoi fare riferimento al Riferimento al linguaggio di interrogazione riferimento per ulteriori dettagli.

Timestream for Live Analytics è progettato per avere un'architettura di acquisizione, archiviazione e interrogazione dei dati completamente disaccoppiata, in cui ogni componente può scalare indipendentemente dagli altri componenti (consentendogli di offrire una scalabilità praticamente infinita per le esigenze di un'applicazione). Ciò significa che Timestream for Live Analytics non si «ribalta» quando le applicazioni inviano centinaia di terabyte di dati al giorno o eseguono milioni di query che elaborano piccole o grandi quantità di dati. Man mano che i dati crescono nel tempo, la latenza delle query in Timestream for Live Analytics rimane per lo più invariata. Questo perché l'architettura di query di Timestream for Live Analytics può sfruttare enormi quantità di parallelismo per elaborare volumi di dati più grandi e scalare automaticamente per soddisfare le esigenze di throughput delle query di un'applicazione.

Modello di dati

Timestream supporta due modelli di dati per le query: il modello flat e il modello di serie temporali.

Nota

I dati in Timestream vengono archiviati utilizzando il modello flat ed è il modello predefinito per l'interrogazione dei dati. Il modello delle serie temporali è un concetto di query-time e viene utilizzato per l'analisi delle serie temporali.

Modello piatto
Modello di serie temporali

Modello piatto

Il modello flat è il modello di dati predefinito di Timestream per le query. Rappresenta i dati delle serie temporali in formato tabulare. I nomi delle dimensioni, l'ora, i nomi delle misure e i valori delle misure vengono visualizzati come colonne. Ogni riga della tabella è un punto dati atomico corrispondente a una misurazione in un momento specifico all'interno di una serie temporale. I database, le tabelle e le colonne di Timestream hanno alcuni vincoli di denominazione. Questi sono descritti in. Limiti del servizio

La tabella seguente mostra un esempio illustrativo di come Timestream memorizza i dati che rappresentano l'utilizzo della CPU, l'utilizzo della memoria e l'attività di rete delle EC2 istanze, quando i dati vengono inviati come record a misura singola. In questo caso, le dimensioni sono la regione, la zona di disponibilità, il cloud privato virtuale e l'istanza delle istanze. IDs EC2 Le misure sono l'utilizzo della CPU, l'utilizzo della memoria e i dati di rete in entrata per le istanze. EC2 Le colonne region, az, vpc e instance_id contengono i valori delle dimensioni. La colonna time contiene il timestamp di ogni record. La colonna measure_name contiene i nomi delle misure rappresentate da cpu-utilization, memory_utilization e network_bytes_in. Le colonne measure_value: :double contengono le misurazioni emesse come doppie (ad esempio utilizzo della CPU e utilizzo della memoria). La colonna measure_value: :bigint contiene le misurazioni emesse come numeri interi, ad esempio i dati di rete in entrata.

Orario	Regione	az	vpc	instance_id	measure_name	measure_value::double	measure_value::bigint
2019-12-04 19:00:00.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	utilizzo della cpu_	35,0	null
2019-12-04 19:00:01.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	utilizzo della cpu_	38.2	null
2019-12-04 19:00:02,000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	utilizzo della cpu_	45,3	null
2019-12-04 19:00:00.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	54,9	null
2019-12-04 19:00:01.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	42,6	null
2019-12-04 19:00:02,000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	33.3	null
2019-12-04 19:00:00.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	network_byte	34.400	null
2019-12-04 19:00:01.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	network_byte	1.500	null
2019-12-04 19:00:02.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	network_byte	6.000	null

Orario	Regione	az	vpc	instance_id	measure_name	cpu_utilization	memory_utilization	network_bytes
2019-12-04 19:00:00.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	metriche	35,0	54,9	34.400
2019-12-04 19:00:01.000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	metriche	38,2	42,6	1.500
2019-12-04 19:00:02,000 000000	us-east-1	Stati Uniti est-1d	vpc-1a2b3c4d	i-1234567890abcdef0	metriche	45,3	33,3	6.600

Modello di serie temporali

Il modello delle serie temporali è un costrutto temporale di interrogazione utilizzato per l'analisi delle serie temporali. Rappresenta i dati come una sequenza ordinata di coppie (tempo, valore di misura). Timestream supporta funzioni di serie temporali come l'interpolazione per consentire di colmare le lacune nei dati. Per utilizzare queste funzioni, è necessario convertire i dati nel modello delle serie temporali utilizzando funzioni come create_time_series. Per ulteriori dettagli, fare riferimento a. Riferimento al linguaggio di interrogazione

Utilizzando l'esempio precedente dell' EC2 istanza, ecco i dati sull'utilizzo della CPU espressi come serie temporali.

Regione	az	vpc	instance_id	cpu_utilization
us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	[{ora: 2019-12-04 19:00:00.000 000000, valore: 35}, {ora: 2019-12-04 19:00:01.000 000000, valore: 38.2}, {ora: 2019-12-04 19:00:02.000 000000, valore: 45.3}]

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Storage

Interrogazioni pianificate