Fonctions d'interpolation - Amazon Timestream

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Fonctions d'interpolation

Si les données de votre série chronologique ne contiennent pas de valeurs pour des événements à certains moments, vous pouvez estimer les valeurs de ces événements manquants à l'aide d'une interpolation. Amazon Timestream prend en charge quatre variantes d'interpolation : l'interpolation linéaire, l'interpolation par spline cubique, l'interpolation de la dernière observation reportée (locf) et l'interpolation constante. Cette section fournit des informations d'utilisation du Timestream pour les fonctions LiveAnalytics d'interpolation, ainsi que des exemples de requêtes.

Informations d'utilisation

Fonction Type de données de sortie Description

interpolate_linear(timeseries, array[timestamp])

séries chronologiques

Complète les données manquantes à l'aide d'une interpolation linéaire.

interpolate_linear(timeseries, timestamp)

double

Complète les données manquantes à l'aide d'une interpolation linéaire.

interpolate_spline_cubic(timeseries, array[timestamp])

séries chronologiques

Complète les données manquantes à l'aide d'une interpolation par splines cubiques.

interpolate_spline_cubic(timeseries, timestamp)

double

Complète les données manquantes à l'aide d'une interpolation par splines cubiques.

interpolate_locf(timeseries, array[timestamp])

séries chronologiques

Complète les données manquantes en utilisant la dernière valeur échantillonnée.

interpolate_locf(timeseries, timestamp)

double

Complète les données manquantes en utilisant la dernière valeur échantillonnée.

interpolate_fill(timeseries, array[timestamp], double)

séries chronologiques

Complète les données manquantes à l'aide d'une valeur constante.

interpolate_fill(timeseries, timestamp, double)

double

Complète les données manquantes à l'aide d'une valeur constante.

Exemples de requêtes

Déterminez l'CPUutilisation moyenne regroupée à intervalles de 30 secondes pour un EC2 hôte spécifique au cours des 2 dernières heures, en remplissant les valeurs manquantes à l'aide d'une interpolation linéaire :

WITH binned_timeseries AS ( SELECT hostname, BIN(time, 30s) AS binned_timestamp, ROUND(AVG(measure_value::double), 2) AS avg_cpu_utilization FROM "sampleDB".DevOps WHERE measure_name = 'cpu_utilization' AND hostname = 'host-Hovjv' AND time > ago(2h) GROUP BY hostname, BIN(time, 30s) ), interpolated_timeseries AS ( SELECT hostname, INTERPOLATE_LINEAR( CREATE_TIME_SERIES(binned_timestamp, avg_cpu_utilization), SEQUENCE(min(binned_timestamp), max(binned_timestamp), 15s)) AS interpolated_avg_cpu_utilization FROM binned_timeseries GROUP BY hostname ) SELECT time, ROUND(value, 2) AS interpolated_cpu FROM interpolated_timeseries CROSS JOIN UNNEST(interpolated_avg_cpu_utilization)

Trouvez l'CPUutilisation moyenne regroupée à intervalles de 30 secondes pour un EC2 hôte spécifique au cours des 2 dernières heures, en remplissant les valeurs manquantes à l'aide d'une interpolation basée sur la dernière observation reportée :

WITH binned_timeseries AS ( SELECT hostname, BIN(time, 30s) AS binned_timestamp, ROUND(AVG(measure_value::double), 2) AS avg_cpu_utilization FROM "sampleDB".DevOps WHERE measure_name = 'cpu_utilization' AND hostname = 'host-Hovjv' AND time > ago(2h) GROUP BY hostname, BIN(time, 30s) ), interpolated_timeseries AS ( SELECT hostname, INTERPOLATE_LOCF( CREATE_TIME_SERIES(binned_timestamp, avg_cpu_utilization), SEQUENCE(min(binned_timestamp), max(binned_timestamp), 15s)) AS interpolated_avg_cpu_utilization FROM binned_timeseries GROUP BY hostname ) SELECT time, ROUND(value, 2) AS interpolated_cpu FROM interpolated_timeseries CROSS JOIN UNNEST(interpolated_avg_cpu_utilization)