Funções de correlação - Amazon Timestream

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Funções de correlação

Dadas duas séries temporais de duração semelhante, as funções de correlação fornecem um coeficiente de correlação, o que explica como as duas séries temporais tendem ao longo do tempo. O coeficiente de correlação varia de a. -1.0 1.0 -1.0indica que as duas séries temporais tendem em direções opostas na mesma taxa, enquanto 1.0 indica que as duas séries temporais tendem na mesma direção e na mesma taxa. Um valor de 0 indica que não há correlação entre as duas séries temporais. Por exemplo, se o preço do petróleo aumentar e o preço das ações de uma empresa petrolífera aumentar, a tendência do aumento do preço do petróleo e o aumento do preço da companhia petrolífera terão um coeficiente de correlação positivo. Um alto coeficiente de correlação positivo indicaria que os dois preços tendem a uma taxa semelhante. Da mesma forma, o coeficiente de correlação entre os preços dos títulos e os rendimentos dos títulos é negativo, indicando que esses dois valores tendem na direção oposta ao longo do tempo.

O Amazon Timestream oferece suporte a duas variantes de funções de correlação. Esta seção fornece informações de uso do Timestream para funções de LiveAnalytics correlação, bem como exemplos de consultas.

Informações de uso

Função Tipo de dados de saída Descrição

correlate_pearson(timeseries, timeseries)

double

Calcula o coeficiente de correlação de Pearson para os dois. timeseries A série temporal deve ter os mesmos timestamps.

correlate_spearman(timeseries, timeseries)

double

Calcula o coeficiente de correlação de Spearman para os dois. timeseries A série temporal deve ter os mesmos timestamps.

Exemplos de consulta

WITH cte_1 AS ( SELECT INTERPOLATE_LINEAR( CREATE_TIME_SERIES(time, measure_value::double), SEQUENCE(min(time), max(time), 10m)) AS result FROM sample.DevOps WHERE measure_name = 'cpu_utilization' AND hostname = 'host-Hovjv' AND time > ago(1h) GROUP BY hostname, measure_name ), cte_2 AS ( SELECT INTERPOLATE_LINEAR( CREATE_TIME_SERIES(time, measure_value::double), SEQUENCE(min(time), max(time), 10m)) AS result FROM sample.DevOps WHERE measure_name = 'cpu_utilization' AND hostname = 'host-Hovjv' AND time > ago(1h) GROUP BY hostname, measure_name ) SELECT correlate_pearson(cte_1.result, cte_2.result) AS result FROM cte_1, cte_2