Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Query
Con Timestream for Live Analytics, puoi archiviare e analizzare facilmente metriche DevOps, dati dei sensori per applicazioni IoT e dati di telemetria industriale per la manutenzione delle apparecchiature, oltre a molti altri casi d'uso. Il motore di query adattivo appositamente progettato in Timestream for Live Analytics consente di accedere ai dati su più livelli di archiviazione utilizzando una singola istruzione SQL. Accede e combina in modo trasparente i dati tra diversi livelli di storage senza che sia necessario specificare la posizione dei dati. Puoi usare SQL per interrogare i dati in Timestream for Live Analytics per recuperare i dati delle serie temporali da una o più tabelle. È possibile accedere alle informazioni sui metadati per database e tabelle. Timestream for Live Analytics SQL supporta anche funzioni integrate per l'analisi delle serie temporali. Puoi fare riferimento al Riferimento al linguaggio di interrogazione riferimento per ulteriori dettagli.
Timestream for Live Analytics è progettato per avere un'architettura di acquisizione, archiviazione e interrogazione dei dati completamente disaccoppiata, in cui ogni componente può scalare indipendentemente dagli altri componenti (consentendogli di offrire una scalabilità praticamente infinita per le esigenze di un'applicazione). Ciò significa che Timestream for Live Analytics non si «ribalta» quando le applicazioni inviano centinaia di terabyte di dati al giorno o eseguono milioni di query che elaborano piccole o grandi quantità di dati. Man mano che i dati crescono nel tempo, la latenza delle query in Timestream for Live Analytics rimane per lo più invariata. Questo perché l'architettura di query di Timestream for Live Analytics può sfruttare enormi quantità di parallelismo per elaborare volumi di dati più grandi e scalare automaticamente per soddisfare le esigenze di throughput delle query di un'applicazione.
Modello di dati
Timestream supporta due modelli di dati per le query: il modello flat e il modello di serie temporali.
Nota
I dati in Timestream vengono archiviati utilizzando il modello flat ed è il modello predefinito per l'interrogazione dei dati. Il modello delle serie temporali è un concetto di query-time e viene utilizzato per l'analisi delle serie temporali.
Modello piatto
Il modello flat è il modello di dati predefinito di Timestream per le query. Rappresenta i dati delle serie temporali in formato tabulare. I nomi delle dimensioni, l'ora, i nomi delle misure e i valori delle misure vengono visualizzati come colonne. Ogni riga della tabella è un punto dati atomico corrispondente a una misurazione in un momento specifico all'interno di una serie temporale. I database, le tabelle e le colonne di Timestream hanno alcuni vincoli di denominazione. Questi sono descritti in. Limiti del servizio
La tabella seguente mostra un esempio illustrativo di come Timestream memorizza i dati che rappresentano l'utilizzo della CPU, l'utilizzo della memoria e l'attività di rete delle EC2 istanze, quando i dati vengono inviati come record a misura singola. In questo caso, le dimensioni sono la regione, la zona di disponibilità, il cloud privato virtuale e l'istanza delle istanze. IDs EC2 Le misure sono l'utilizzo della CPU, l'utilizzo della memoria e i dati di rete in entrata per le istanze. EC2 Le colonne region, az, vpc e instance_id contengono i valori delle dimensioni. La colonna time contiene il timestamp di ogni record. La colonna measure_name contiene i nomi delle misure rappresentate da cpu-utilization, memory_utilization e network_bytes_in. Le colonne measure_value: :double contengono le misurazioni emesse come doppie (ad esempio utilizzo della CPU e utilizzo della memoria). La colonna measure_value: :bigint contiene le misurazioni emesse come numeri interi, ad esempio i dati di rete in entrata.
Orario | Regione | az | vpc | instance_id | measure_name | measure_value::double | measure_value::bigint |
---|---|---|---|---|---|---|---|
2019-12-04 19:00:00.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
utilizzo della cpu_ |
35,0 |
null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
utilizzo della cpu_ |
38.2 |
null |
2019-12-04 19:00:02,000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
utilizzo della cpu_ |
45,3 |
null |
2019-12-04 19:00:00.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
54,9 |
null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
42,6 |
null |
2019-12-04 19:00:02,000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
33.3 |
null |
2019-12-04 19:00:00.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_byte |
34.400 |
null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_byte |
1.500 |
null |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_byte |
6.000 |
null |
La tabella seguente mostra un esempio illustrativo di come Timestream memorizza i dati che rappresentano l'utilizzo della CPU, l'utilizzo della memoria e l'attività di rete delle EC2 istanze, quando i dati vengono inviati come record multimisura.
Orario | Regione | az | vpc | instance_id | measure_name | cpu_utilization | memory_utilization | network_bytes |
---|---|---|---|---|---|---|---|---|
2019-12-04 19:00:00.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
metriche |
35,0 |
54,9 |
34.400 |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
metriche |
38,2 |
42,6 |
1.500 |
2019-12-04 19:00:02,000 000000 |
us-east-1 |
Stati Uniti est-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
metriche |
45,3 |
33,3 |
6.600 |
Modello di serie temporali
Il modello delle serie temporali è un costrutto temporale di interrogazione utilizzato per l'analisi delle serie temporali. Rappresenta i dati come una sequenza ordinata di coppie (tempo, valore di misura). Timestream supporta funzioni di serie temporali come l'interpolazione per consentire di colmare le lacune nei dati. Per utilizzare queste funzioni, è necessario convertire i dati nel modello delle serie temporali utilizzando funzioni come create_time_series. Per ulteriori dettagli, fare riferimento a. Riferimento al linguaggio di interrogazione
Utilizzando l'esempio precedente dell' EC2 istanza, ecco i dati sull'utilizzo della CPU espressi come serie temporali.
Regione | az | vpc | instance_id | cpu_utilization |
---|---|---|---|---|
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
[{ora: 2019-12-04 19:00:00.000 000000, valore: 35}, {ora: 2019-12-04 19:00:01.000 000000, valore: 38.2}, {ora: 2019-12-04 19:00:02.000 000000, valore: 45.3}] |