Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Consultas
Con Timestream for Live Analytics, puede almacenar y analizar fácilmente métricas para datos de sensores para DevOps aplicaciones de IoT y datos de telemetría industrial para el mantenimiento de equipos, así como muchos otros casos de uso. El motor de consultas adaptativo y diseñado específicamente de Timestream for Live Analytics le permite acceder a los datos de todos los niveles de almacenamiento mediante una sola afirmación. SQL Accede a los datos de todos los niveles de almacenamiento y los combina de forma transparente sin necesidad de especificar la ubicación de los datos. Puede utilizar esta opción SQL para consultar datos en Timestream for Live Analytics para recuperar datos de series temporales de una o más tablas. Puede acceder a la información de metadatos de las bases de datos y las tablas. Timestream for Live Analytics SQL también admite funciones integradas para el análisis de series temporales. Puede consultar la Referencia del lenguaje de consulta referencia para obtener más detalles.
Timestream for Live Analytics está diseñado para tener una arquitectura de consulta, almacenamiento e ingesta de datos totalmente disociada, en la que cada componente puede escalarse de forma independiente de los demás componentes (lo que le permite ofrecer una escala prácticamente infinita para las necesidades de una aplicación). Esto significa que Timestream for Live Analytics no se interrumpe cuando las aplicaciones envían cientos de terabytes de datos al día o ejecutan millones de consultas para procesar cantidades pequeñas o grandes de datos. A medida que los datos aumentan con el tiempo, la latencia de las consultas en Timestream for Live Analytics permanece prácticamente inalterada. Esto se debe a que la arquitectura de consultas de Timestream for Live Analytics puede aprovechar enormes cantidades de paralelismo para procesar volúmenes de datos más grandes y escalar automáticamente para adaptarse a las necesidades de rendimiento de las consultas de una aplicación.
Modelo de datos
Timestream admite dos modelos de datos para las consultas: el modelo plano y el modelo de series temporales.
nota
Los datos de Timestream se almacenan mediante el modelo plano y es el modelo predeterminado para consultar datos. El modelo de series temporales es un concepto de tiempo de consulta y se utiliza para el análisis de series temporales.
Modelo plano
El modelo plano es el modelo de datos predeterminado de Timestream para las consultas. Representa datos de series temporales en formato tabular. Los nombres de las dimensiones, el tiempo, los nombres de las medidas y los valores de las medidas aparecen como columnas. Cada fila de la tabla es un punto de datos atómicos que corresponde a una medición en un momento específico dentro de una serie temporal. Las bases de datos, tablas y columnas de Timestream tienen algunas restricciones de nomenclatura. Estas se describen en. Límites de los servicios
La siguiente tabla muestra un ejemplo ilustrativo de cómo Timestream almacena los datos que representan la CPU utilización, la utilización de la memoria y la actividad de la red de las EC2 instancias, cuando los datos se envían como un registro de medida única. En este caso, las dimensiones son la región, la zona de disponibilidad, la nube privada virtual y la instancia IDs de las instancias. EC2 Las medidas son la CPU utilización, la utilización de la memoria y los datos de red entrantes de las EC2 instancias. Las columnas region, az, vpc e instance_id contienen los valores de las dimensiones. La columna time contiene la marca de tiempo de cada registro. La columna measure_name contiene los nombres de las medidas representadas por cpu-utilization, memory_utilization y network_bytes_in. Las columnas measure_value: :double contienen las medidas emitidas como dobles (por ejemplo, la utilización y la utilización de la memoria). CPU La columna measure_value: :bigint contiene las medidas emitidas como números enteros, por ejemplo, los datos de red entrantes.
Tiempo | region | az | vpc | instance_id | measure_name | measure_value::double | measure_value::bigint |
---|---|---|---|---|---|---|---|
2019-12-04 19:00:00.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
utilización de la CPU |
35,0 |
null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
utilización de la CPU |
38.2 |
null |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
utilización de la CPU |
45,3 |
null |
2019-12-04 19:00:00.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
54,9 |
null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
42.6 |
null |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
3.3 |
null |
2019-12-04 19:00:00.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
34.400 |
null |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
1500 |
null |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
6000 |
null |
La siguiente tabla muestra un ejemplo ilustrativo de cómo Timestream almacena los datos que representan la CPU utilización, la utilización de la memoria y la actividad de la red de las EC2 instancias, cuando los datos se envían como un registro de múltiples medidas.
Tiempo | region | az | vpc | instance_id | measure_name | cpu_utilization | memory_utilization | bytes de red |
---|---|---|---|---|---|---|---|---|
04/12/2019 19:00:00.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
35,0 |
54,9 |
34.400 |
2019-12-04 19:00:01.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
38.2 |
42,6 |
1500 |
2019-12-04 19:00:02.000 000000 |
us-east-1 |
US-East-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
45.3 |
3.3 |
6600 |
Modelo de series temporales
El modelo de series temporales es una construcción temporal de consulta que se utiliza para el análisis de series temporales. Representa los datos como una secuencia ordenada de pares (tiempo, valor de medición). Timestream admite funciones de series temporales, como la interpolación, para que pueda cubrir los vacíos en los datos. Para utilizar estas funciones, debe convertir los datos al modelo de series temporales mediante funciones como create_time_series. Consulte para obtener más información. Referencia del lenguaje de consulta
Utilizando el ejemplo anterior de la EC2 instancia, aquí están los datos de CPU uso expresados como una serie temporal.
region | az | vpc | instance_id | cpu_utilization |
---|---|---|---|---|
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
[{hora: 2019-12-04 19:00:00.000 000000, valor: 35}, {hora: 2019-12-04 19:00:01.000 000000, valor: 38,2}, {hora: 2019-12-04 19:00:02.000 000000, valor: 45,3}] |