Requêtes

Avec Timestream for Live Analytics, vous pouvez facilement stocker et analyser des métriques DevOps, des données de capteurs pour les applications IoT et des données de télémétrie industrielle pour la maintenance des équipements, ainsi que pour de nombreux autres cas d'utilisation. Le moteur de requête adaptatif spécialement conçu dans Timestream for Live Analytics vous permet d'accéder aux données à travers les niveaux de stockage à l'aide d'une seule instruction. SQL Il accède aux données et les combine de manière transparente entre les niveaux de stockage sans que vous ayez à spécifier l'emplacement des données. Vous pouvez l'utiliser SQL pour interroger des données dans Timestream for Live Analytics afin de récupérer des données de séries chronologiques à partir d'une ou de plusieurs tables. Vous pouvez accéder aux informations de métadonnées des bases de données et des tables. Timestream for Live Analytics prend SQL également en charge les fonctions intégrées d'analyse des séries chronologiques. Vous pouvez vous référer à la Référence du langage de requête référence pour plus de détails.

Timestream for Live Analytics est conçu pour disposer d'une architecture d'ingestion, de stockage et de requête de données totalement découplée, dans laquelle chaque composant peut évoluer indépendamment des autres composants (ce qui lui permet d'offrir une évolutivité pratiquement infinie pour répondre aux besoins d'une application). Cela signifie que Timestream for Live Analytics ne « bascule » pas lorsque vos applications envoient des centaines de téraoctets de données par jour ou exécutent des millions de requêtes traitant de petites ou grandes quantités de données. À mesure que vos données augmentent au fil du temps, la latence des requêtes dans Timestream for Live Analytics reste pratiquement inchangée. Cela est dû au fait que l'architecture de requêtes Timestream for Live Analytics peut tirer parti d'un parallélisme massif pour traiter des volumes de données plus importants et s'adapter automatiquement aux besoins de débit de requêtes d'une application.

Modèle de données

Timestream prend en charge deux modèles de données pour les requêtes : le modèle plat et le modèle de série chronologique.

Note

Les données de Timestream sont stockées à l'aide du modèle plat et il s'agit du modèle par défaut pour les requêtes de données. Le modèle de série chronologique est un concept basé sur le temps de requête et est utilisé pour l'analyse de séries chronologiques.

Modèle plat
Modèle de série chronologique

Modèle plat

Le modèle plat est le modèle de données par défaut de Timestream pour les requêtes. Il représente les données de séries chronologiques sous forme de tableau. Les noms des dimensions, l'heure, les noms des mesures et les valeurs des mesures apparaissent sous forme de colonnes. Chaque ligne du tableau est un point de données atomique correspondant à une mesure effectuée à un moment précis au sein d'une série chronologique. Les bases de données, les tables et les colonnes Timestream sont soumises à certaines contraintes de dénomination. Ils sont décrits dansService Limits.

Le tableau ci-dessous montre un exemple illustrant la manière dont Timestream stocke les données représentant l'CPUutilisation, l'utilisation de la mémoire et l'activité réseau des EC2 instances, lorsque les données sont envoyées sous forme d'enregistrement à mesure unique. Dans ce cas, les dimensions sont la région, la zone de disponibilité, le cloud privé virtuel et l'instance IDs des EC2 instances. Les mesures sont l'CPUutilisation, l'utilisation de la mémoire et les données réseau entrantes pour les EC2 instances. Les colonnes region, az, vpc et instance_id contiennent les valeurs des dimensions. L'heure de la colonne contient l'horodatage de chaque enregistrement. La colonne measure_name contient les noms des mesures représentées par cpu-utilization, memory_utilization et network_bytes_in. Les colonnes measure_value : :double contiennent les mesures émises sous forme de doubles (par exemple, CPU l'utilisation et l'utilisation de la mémoire). La colonne measure_value : :bigint contient les mesures émises sous forme d'entiers, par exemple les données réseau entrantes.

Heure	region	az	vpc	instance_id	nom_mesure	valeur_mesure : double	value_mesure : :bigint
2019-12-04 19:00:00.000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	utilisation du processeur	35,0	null
2019-12-04 19:00:01 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	utilisation du processeur	38,2	null
2019-12-04 19:00:02 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	utilisation du processeur	45,3	null
2019-12-04 19:00:00.000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	54,9	null
2019-12-04 19:00:01 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	42,6	null
2019-12-04 19:00:02 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	33,3	null
2019-12-04 19:00:00.000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	octets_réseau	34 400	null
2019-12-04 19:00:01 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	octets_réseau	1 500	null
2019-12-04 19:00:02 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	octets_réseau	6 000	null

Heure	region	az	vpc	instance_id	nom_mesure	utilisation du processeur	memory_utilization	octets_réseau
2019-12-04 19:00:00.000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	metrics	35,0	54,9	34 400
2019-12-04 19:00:01 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	metrics	38,2	42,6	1 500
2019-12-04 19:00:02 000 000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	metrics	45,3	33,3	6 600

Modèle de série chronologique

Le modèle de série chronologique est une construction temporelle de requête utilisée pour l'analyse de séries chronologiques. Il représente les données sous la forme d'une séquence ordonnée de paires (temps, valeur de mesure). Timestream prend en charge les fonctions de séries chronologiques telles que l'interpolation pour vous permettre de combler les lacunes de vos données. Pour utiliser ces fonctions, vous devez convertir vos données dans le modèle de série chronologique à l'aide de fonctions telles que create_time_series. Reportez-vous à Référence du langage de requête pour plus de détails.

À l'aide de l'exemple précédent de l'EC2instance, voici les données CPU d'utilisation exprimées sous forme de série chronologique.

region	az	vpc	instance_id	utilisation du processeur
us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	[{heure : 2019-12-04 19:00:00.000 000000, valeur : 35}, {heure : 2019-12-04 19:00:01.000 000000, valeur : 38.2}, {heure : 2019-12-04 19:00:02.000 000000, valeur : 45,3}]

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Stockage

Requêtes planifiées