Consultas - Amazon Timestream

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Consultas

Con Timestream for Live Analytics, puede almacenar y analizar fácilmente métricas para datos de sensores para DevOps aplicaciones de IoT y datos de telemetría industrial para el mantenimiento de equipos, así como muchos otros casos de uso. El motor de consultas adaptativo y diseñado específicamente de Timestream for Live Analytics le permite acceder a los datos de todos los niveles de almacenamiento mediante una sola afirmación. SQL Accede a los datos de todos los niveles de almacenamiento y los combina de forma transparente sin necesidad de especificar la ubicación de los datos. Puede utilizar esta opción SQL para consultar datos en Timestream for Live Analytics para recuperar datos de series temporales de una o más tablas. Puede acceder a la información de metadatos de las bases de datos y las tablas. Timestream for Live Analytics SQL también admite funciones integradas para el análisis de series temporales. Puede consultar la Referencia del lenguaje de consulta referencia para obtener más detalles.

Timestream for Live Analytics está diseñado para tener una arquitectura de consulta, almacenamiento e ingesta de datos totalmente disociada, en la que cada componente puede escalarse de forma independiente de los demás componentes (lo que le permite ofrecer una escala prácticamente infinita para las necesidades de una aplicación). Esto significa que Timestream for Live Analytics no se interrumpe cuando las aplicaciones envían cientos de terabytes de datos al día o ejecutan millones de consultas para procesar cantidades pequeñas o grandes de datos. A medida que los datos aumentan con el tiempo, la latencia de las consultas en Timestream for Live Analytics permanece prácticamente inalterada. Esto se debe a que la arquitectura de consultas de Timestream for Live Analytics puede aprovechar enormes cantidades de paralelismo para procesar volúmenes de datos más grandes y escalar automáticamente para adaptarse a las necesidades de rendimiento de las consultas de una aplicación.

Modelo de datos

Timestream admite dos modelos de datos para las consultas: el modelo plano y el modelo de series temporales.

nota

Los datos de Timestream se almacenan mediante el modelo plano y es el modelo predeterminado para consultar datos. El modelo de series temporales es un concepto de tiempo de consulta y se utiliza para el análisis de series temporales.

Modelo plano

El modelo plano es el modelo de datos predeterminado de Timestream para las consultas. Representa datos de series temporales en formato tabular. Los nombres de las dimensiones, el tiempo, los nombres de las medidas y los valores de las medidas aparecen como columnas. Cada fila de la tabla es un punto de datos atómicos que corresponde a una medición en un momento específico dentro de una serie temporal. Las bases de datos, tablas y columnas de Timestream tienen algunas restricciones de nomenclatura. Estas se describen en. Límites de los servicios

La siguiente tabla muestra un ejemplo ilustrativo de cómo Timestream almacena los datos que representan la CPU utilización, la utilización de la memoria y la actividad de la red de las EC2 instancias, cuando los datos se envían como un registro de medida única. En este caso, las dimensiones son la región, la zona de disponibilidad, la nube privada virtual y la instancia IDs de las instancias. EC2 Las medidas son la CPU utilización, la utilización de la memoria y los datos de red entrantes de las EC2 instancias. Las columnas region, az, vpc e instance_id contienen los valores de las dimensiones. La columna time contiene la marca de tiempo de cada registro. La columna measure_name contiene los nombres de las medidas representadas por cpu-utilization, memory_utilization y network_bytes_in. Las columnas measure_value: :double contienen las medidas emitidas como dobles (por ejemplo, la utilización y la utilización de la memoria). CPU La columna measure_value: :bigint contiene las medidas emitidas como números enteros, por ejemplo, los datos de red entrantes.

Tiempo region az vpc instance_id measure_name measure_value::double measure_value::bigint

2019-12-04 19:00:00.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

utilización de la CPU

35,0

null

2019-12-04 19:00:01.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

utilización de la CPU

38.2

null

2019-12-04 19:00:02.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

utilización de la CPU

45,3

null

2019-12-04 19:00:00.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

54,9

null

2019-12-04 19:00:01.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

42.6

null

2019-12-04 19:00:02.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

3.3

null

2019-12-04 19:00:00.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

network_bytes

34.400

null

2019-12-04 19:00:01.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

network_bytes

1500

null

2019-12-04 19:00:02.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

network_bytes

6000

null

La siguiente tabla muestra un ejemplo ilustrativo de cómo Timestream almacena los datos que representan la CPU utilización, la utilización de la memoria y la actividad de la red de las EC2 instancias, cuando los datos se envían como un registro de múltiples medidas.

Tiempo region az vpc instance_id measure_name cpu_utilization memory_utilization bytes de red

04/12/2019 19:00:00.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

métricas

35,0

54,9

34.400

2019-12-04 19:00:01.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

métricas

38.2

42,6

1500

2019-12-04 19:00:02.000 000000

us-east-1

US-East-1d

vpc-1a2b3c4d

i-1234567890abcdef0

métricas

45.3

3.3

6600

Modelo de series temporales

El modelo de series temporales es una construcción temporal de consulta que se utiliza para el análisis de series temporales. Representa los datos como una secuencia ordenada de pares (tiempo, valor de medición). Timestream admite funciones de series temporales, como la interpolación, para que pueda cubrir los vacíos en los datos. Para utilizar estas funciones, debe convertir los datos al modelo de series temporales mediante funciones como create_time_series. Consulte para obtener más información. Referencia del lenguaje de consulta

Utilizando el ejemplo anterior de la EC2 instancia, aquí están los datos de CPU uso expresados como una serie temporal.

region az vpc instance_id cpu_utilization

us-east-1

us-east-1d

vpc-1a2b3c4d

i-1234567890abcdef0

[{hora: 2019-12-04 19:00:00.000 000000, valor: 35}, {hora: 2019-12-04 19:00:01.000 000000, valor: 38,2}, {hora: 2019-12-04 19:00:02.000 000000, valor: 45,3}]