Fonctions de corrélation - Amazon Timestream

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Fonctions de corrélation

Pour deux séries chronologiques de longueur similaire, les fonctions de corrélation fournissent un coefficient de corrélation, qui explique l'évolution des deux séries chronologiques dans le temps. Le coefficient de corrélation est compris entre -1.0 et1.0. -1.0indique que les deux séries chronologiques évoluent dans des directions opposées au même rythme, alors qu'1.0indique que les deux séries chronologiques évoluent dans la même direction au même rythme. La valeur de 0 indique l'absence de corrélation entre les deux séries chronologiques. Par exemple, si le prix du pétrole augmente et que le cours de l'action d'une société pétrolière augmente, la tendance de la hausse du prix du pétrole et celle de la société pétrolière auront un coefficient de corrélation positif. Un coefficient de corrélation positif élevé indiquerait que les deux prix évoluent au même rythme. De même, le coefficient de corrélation entre les cours des obligations et les rendements obligataires est négatif, ce qui indique que ces deux valeurs évoluent dans le sens inverse au fil du temps.

Amazon Timestream prend en charge deux variantes de fonctions de corrélation. Cette section fournit des informations d'utilisation du Timestream pour les fonctions de LiveAnalytics corrélation, ainsi que des exemples de requêtes.

Informations d'utilisation

Fonction Type de données de sortie Description

correlate_pearson(timeseries, timeseries)

double

Calcule le coefficient de corrélation de Pearson pour les deux. timeseries Les séries temporelles doivent avoir les mêmes horodatages.

correlate_spearman(timeseries, timeseries)

double

Calcule le coefficient de corrélation de Spearman pour les deux. timeseries Les séries temporelles doivent avoir les mêmes horodatages.

Exemples de requêtes

WITH cte_1 AS ( SELECT INTERPOLATE_LINEAR( CREATE_TIME_SERIES(time, measure_value::double), SEQUENCE(min(time), max(time), 10m)) AS result FROM sample.DevOps WHERE measure_name = 'cpu_utilization' AND hostname = 'host-Hovjv' AND time > ago(1h) GROUP BY hostname, measure_name ), cte_2 AS ( SELECT INTERPOLATE_LINEAR( CREATE_TIME_SERIES(time, measure_value::double), SEQUENCE(min(time), max(time), 10m)) AS result FROM sample.DevOps WHERE measure_name = 'cpu_utilization' AND hostname = 'host-Hovjv' AND time > ago(1h) GROUP BY hostname, measure_name ) SELECT correlate_pearson(cte_1.result, cte_2.result) AS result FROM cte_1, cte_2