Consultas - Amazon Timestream

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Consultas

Com o Timestream for Live Analytics, você pode armazenar e analisar facilmente métricas DevOps, dados de sensores para aplicativos de IoT e dados de telemetria industrial para manutenção de equipamentos, além de muitos outros casos de uso. O mecanismo de consulta adaptável e criado especificamente no Timestream for Live Analytics permite que você acesse dados em vários níveis de armazenamento usando uma única instrução. SQL Ele acessa e combina dados de forma transparente em todos os níveis de armazenamento sem exigir que você especifique a localização dos dados. Você pode usar SQL para consultar dados no Timestream for Live Analytics para recuperar dados de séries temporais de uma ou mais tabelas. Você pode acessar as informações de metadados para bancos de dados e tabelas. O Timestream for Live Analytics SQL também oferece suporte a funções integradas para análise de séries temporais. Você pode consultar a Referência da linguagem de consulta referência para obter detalhes adicionais.

O Timestream for Live Analytics foi projetado para ter uma arquitetura de ingestão, armazenamento e consulta de dados totalmente dissociada, na qual cada componente pode ser escalado independentemente de outros componentes (permitindo que ele ofereça uma escala praticamente infinita para as necessidades de um aplicativo). Isso significa que o Timestream for Live Analytics não “tomba” quando seus aplicativos enviam centenas de terabytes de dados por dia ou executam milhões de consultas processando pequenas ou grandes quantidades de dados. À medida que seus dados crescem com o tempo, a latência da consulta no Timestream for Live Analytics permanece praticamente inalterada. Isso ocorre porque a arquitetura de consulta Timestream for Live Analytics pode aproveitar grandes quantidades de paralelismo para processar volumes de dados maiores e escalar automaticamente para atender às necessidades de taxa de transferência de consultas de um aplicativo.

Modelo de dados

O Timestream oferece suporte a dois modelos de dados para consultas: o modelo plano e o modelo de série temporal.

nota

Os dados no Timestream são armazenados usando o modelo plano e é o modelo padrão para consultar dados. O modelo de séries temporais é um conceito de tempo de consulta e é usado para análise de séries temporais.

Modelo plano

O modelo plano é o modelo de dados padrão do Timestream para consultas. Ele representa dados de séries temporais em formato tabular. Os nomes das dimensões, a hora, os nomes das medidas e os valores das medidas aparecem como colunas. Cada linha na tabela é um ponto de dados atômico correspondente a uma medição em um momento específico dentro de uma série temporal. Bancos de dados, tabelas e colunas do Timestream têm algumas restrições de nomenclatura. Esses são descritos emLimites do serviço.

A tabela abaixo mostra um exemplo ilustrativo de como o Timestream armazena dados que representam a CPU utilização, a utilização da memória e a atividade de rede das EC2 instâncias, quando os dados são enviados como um registro de medida única. Nesse caso, as dimensões são a região, a zona de disponibilidade, a nuvem privada virtual e a instância IDs das EC2 instâncias. As medidas são a CPU utilização, a utilização da memória e os dados de rede de entrada das instâncias. EC2 As colunas region, az, vpc e instance_id contêm os valores da dimensão. A hora da coluna contém a data e hora de cada registro. A coluna measure_name contém os nomes das medidas representadas por cpu-utilization, memory_utilization e network_bytes_in. As colunas measure_value: :double contêm medições emitidas como duplas (por exemplo, utilização e CPU utilização de memória). A coluna measure_value: :bigint contém medições emitidas como números inteiros, por exemplo, os dados de entrada da rede.

Tempo região az vpc instance_id nome_medida valor_medida::duplo valor_medida::bigint

2019-12-04 19:00:00.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

utilização_da CPU

35,0

nulo

2019-12-04 19:00:01.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

utilização_da CPU

38,2

nulo

2019-12-04 19:00:02.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

utilização_da CPU

45,3

nulo

2019-12-04 19:00:00.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

54,9

nulo

2019-12-04 19:00:01.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

42.6

nulo

2019-12-04 19:00:02.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

memory_utilization

33.3

nulo

2019-12-04 19:00:00.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

bytes_de_rede

34.400

nulo

2019-12-04 19:00:01.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

bytes_de_rede

1.500

nulo

2019-12-04 19:00:02.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

bytes_de_rede

6.000

nulo

A tabela abaixo mostra um exemplo ilustrativo de como o Timestream armazena dados que representam a CPU utilização, a utilização da memória e a atividade de rede das EC2 instâncias, quando os dados são enviados como um registro de várias medidas.

Tempo região az vpc instance_id nome_medida utilização_da CPU memory_utilization bytes_de_rede

2019-12-04 19:00:00.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

métricas

35,0

54,9

34.400

2019-12-04 19:00:01.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

métricas

38,2

42.6

1.500

2019-12-04 19:00:02.000 000000

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

métricas

45,3

33.3

6.600

Modelo de série temporal

O modelo de séries temporais é uma construção de tempo de consulta usada para análise de séries temporais. Ele representa os dados como uma sequência ordenada de pares (tempo, valor da medida). O Timestream suporta funções de séries temporais, como interpolação, para permitir que você preencha as lacunas em seus dados. Para usar essas funções, você deve converter seus dados no modelo de série temporal usando funções como create_time_series. Consulte Referência da linguagem de consulta para obter mais detalhes.

Usando o exemplo anterior da EC2 instância, aqui estão os dados de CPU utilização expressos como uma série temporal.

região az vpc instance_id utilização_da CPU

us-east-1

leste dos EUA - 1d

vpc-1a2b3c4d

i-1234567890abcdef0

[{horário: 04/12/2019 19:00:00.000 000000, valor: 35}, {horário: 04/12/2019 19:00:01.000 000000, valor: 38,2}, {horário: 04/12/2019 19:00:02.000 000000, valor: 45,3}]