집계 함수 - Amazon Timestream

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

집계 함수

에 대한 Timestream은 다음과 같은 집계 함수를 LiveAnalytics 지원합니다.

함수 출력 데이터 유형 설명

임의(x)

[입력과 동일]

존재하는 경우 임의의 null이 아닌 값 x를 반환합니다.

SELECT arbitrary(t.c) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 1

array_agg(x)

array<[입력과 동일]

입력 x 요소에서 생성된 배열을 반환합니다.

SELECT array_agg(t.c) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: [ 1,2,3,4 ]

평균(x)

double

모든 입력 값의 평균(산술 평균)을 반환합니다.

SELECT avg(t.c) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 2.5

bool_and(boolean) every(boolean)

boolean

모든 입력 값이 인 TRUE 경우 를 반환하고TRUE, 그렇지 않은 경우 를 반환합니다FALSE.

SELECT bool_and(t.c) FROM (VALUES true, true, false, true) AS t(c)

예제 결과: false

bool_or(부울)

boolean

입력 값이 인 TRUE 경우 를 반환하고TRUE, 그렇지 않은 경우 를 반환합니다FALSE.

SELECT bool_or(t.c) FROM (VALUES true, true, false, true) AS t(c)

예제 결과: true

count(*) count(x)

bigint

count(*)는 입력 행 수를 반환합니다.

count(x)는 null이 아닌 입력 값의 수를 반환합니다.

SELECT count(t.c) FROM (VALUES true, true, false, true) AS t(c)

예제 결과: 4

count_if(x)

bigint

TRUE 입력 값의 수를 반환합니다.

SELECT count_if(t.c) FROM (VALUES true, true, false, true) AS t(c)

예제 결과: 3

geometric_mean(x)

double

모든 입력 값의 기하 평균을 반환합니다.

SELECT geometric_mean(t.c) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 2.213363839400643

max_by(x, y)

[x와 동일]

모든 입력 값에 대해 y의 최대값과 연결된 x의 값을 반환합니다.

SELECT max_by(t.c1, t.c2) FROM (VALUES (('a', 1)), (('b', 2)), (('c', 3)), (('d', 4))) AS t(c1, c2)

예제 결과: d

max_by(x, y, n)

배열<[x와 동일]>

y의 모든 입력 값 중 가장 큰 n과 연결된 x의 n 값을 y의 내림차순으로 반환합니다.

SELECT max_by(t.c1, t.c2, 2) FROM (VALUES (('a', 1)), (('b', 2)), (('c', 3)), (('d', 4))) AS t(c1, c2)

예제 결과: [ d,c ]

min_by(x, y)

[x와 동일]

모든 입력 값에 대해 y의 최소값과 연결된 x의 값을 반환합니다.

SELECT min_by(t.c1, t.c2) FROM (VALUES (('a', 1)), (('b', 2)), (('c', 3)), (('d', 4))) AS t(c1, c2)

예제 결과: a

min_by(x, y, n)

배열<[x와 동일]>

y의 오름차순으로 y의 모든 입력 값 중 가장 작은 n과 연결된 x의 n 값을 반환합니다.

SELECT min_by(t.c1, t.c2, 2) FROM (VALUES (('a', 1)), (('b', 2)), (('c', 3)), (('d', 4))) AS t(c1, c2)

예제 결과: [ a,b ]

max(x)

[입력과 동일]

모든 입력 값의 최대값을 반환합니다.

SELECT max(t.c) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 4

최대(x, n)

배열<[x와 동일]>

x의 모든 입력 값의 최대 n개의 값을 반환합니다.

SELECT max(t.c, 2) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: [ 4,3 ]

min(x)

[입력과 동일]

모든 입력 값의 최소값을 반환합니다.

SELECT min(t.c) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 1

min(x, n)

배열<[x와 동일]>

x의 모든 입력 값 중 최소 n개의 값을 반환합니다.

SELECT min(t.c, 2) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: [ 1,2 ]

sum(x)

[입력과 동일]

모든 입력 값의 합계를 반환합니다.

SELECT sum(t.c) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 10

bitwise_and_agg(x)

bigint

AND 모든 입력 값의 비트 단위를 2's 보완 표현으로 반환합니다.

SELECT bitwise_and_agg(t.c) FROM (VALUES 1, -3) AS t(c)

예제 결과: 1

bitwise_or_agg(x)

bigint

모든 입력 값의 비트 OR을 2's 보완 표현으로 반환합니다.

SELECT bitwise_or_agg(t.c) FROM (VALUES 1, -3) AS t(c)

예제 결과: -3

약_구분(x)

bigint

고유한 입력 값의 대략적인 수를 반환합니다. 이 함수는 수(DISTINCT x)의 근사치를 제공합니다. 모든 입력 값이 null이면 0이 반환됩니다. 이 함수는 가능한 모든 세트에 대한 (대략 정상) 오류 분포의 표준 편차인 2.3%의 표준 오차를 생성해야 합니다. 특정 입력 세트에 대한 오류 상한을 보장하지는 않습니다.

SELECT approx_distinct(t.c) FROM (VALUES 1, 2, 3, 4, 8) AS t(c)

예제 결과: 5

약_구분(x, e)

bigint

고유한 입력 값의 대략적인 수를 반환합니다. 이 함수는 수(DISTINCT x)의 근사치를 제공합니다. 모든 입력 값이 null이면 0이 반환됩니다. 이 함수는 가능한 모든 세트에 대한 (대략 정상) 오류 분포의 표준 편차인 e 이하의 표준 오차를 생성해야 합니다. 특정 입력 세트에 대한 오류 상한을 보장하지는 않습니다. 이 함수를 현재 구현하려면 e가 [0.0040625, 0.26000] 범위에 있어야 합니다.

SELECT approx_distinct(t.c, 0.2) FROM (VALUES 1, 2, 3, 4, 8) AS t(c)

예제 결과: 5

약_백분위수(x, 백분율)

[x와 동일]

지정된 백분율에서 x의 모든 입력 값에 대한 대략적인 백분위수를 반환합니다. 백분율 값은 0에서 1 사이여야 하며 모든 입력 행에 대해 일정해야 합니다.

SELECT approx_percentile(t.c, 0.4) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 2

약_백분위수(x, 백분율)

배열<[x와 동일]>

지정된 각 백분율에서 x의 모든 입력 값에 대한 대략적인 백분위수를 반환합니다. 백분율 배열의 각 요소는 0과 1 사이여야 하며, 배열은 모든 입력 행에 대해 일정해야 합니다.

SELECT approx_percentile(t.c, ARRAY[0.1, 0.8, 0.8]) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: [ 1,4,4 ]

약_백분위수(x, w, 백분율)

[x와 동일]

p 백분율에서 항목별 가중치 w를 사용하여 x의 모든 입력 값에 대한 대략적인 가중치 백분위수를 반환합니다. 가중치는 1 이상의 정수 값이어야 합니다. 백분위수 세트의 값 x에 대한 복제 수입니다. p 값은 0에서 1 사이여야 하며 모든 입력 행에 대해 일정해야 합니다.

SELECT approx_percentile(t.c, 1, 0.1) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 1

약_백분위수(x, w, 백분율)

배열<[x와 동일]>

배열에 지정된 지정된 각 백분율에서 항목별 가중치 w를 사용하여 x의 모든 입력 값에 대한 대략적인 가중치 백분위수를 반환합니다. 가중치는 1 이상의 정수 값이어야 합니다. 백분위수 세트의 값 x에 대한 복제 수입니다. 배열의 각 요소는 0과 1 사이여야 하며 배열은 모든 입력 행에 대해 일정해야 합니다.

SELECT approx_percentile(t.c, 1, ARRAY[0.1, 0.8, 0.8]) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: [ 1,4,4 ]

approx_percentile(x, w, 백분율, 정확도)

[x와 동일]

최대 순위 오류 정확도와 함께 p의 항목별 가중치 w를 사용하여 x의 모든 입력 값에 대한 대략적인 가중치 백분위수를 반환합니다. 가중치는 1 이상의 정수 값이어야 합니다. 백분위수 세트의 값 x에 대한 복제 수입니다. p 값은 0에서 1 사이여야 하며 모든 입력 행에 대해 일정해야 합니다. 정확도는 0보다 크고 1보다 작아야 하며 모든 입력 행에 대해 일정해야 합니다.

SELECT approx_percentile(t.c, 1, 0.1, 0.5) FROM (VALUES 1, 2, 3, 4) AS t(c)

예제 결과: 1

corr(y, x)

double

입력 값의 상관 계수를 반환합니다.

SELECT corr(t.c1, t.c2) FROM (VALUES ((1, 1)), ((2, 2)), ((3, 3)), ((4, 4))) AS t(c1, c2)

예제 결과: 1.0

covar_pop(y, x)

double

입력 값의 모집단 공분산을 반환합니다.

SELECT covar_pop(t.c1, t.c2) FROM (VALUES ((1, 1)), ((2, 2)), ((3, 3)), ((4, 4))) AS t(c1, c2)

예제 결과: 1.25

covar_samp(y, x)

double

입력 값의 샘플 공분산을 반환합니다.

SELECT covar_samp(t.c1, t.c2) FROM (VALUES ((1, 1)), ((2, 2)), ((3, 3)), ((4, 4))) AS t(c1, c2)

예제 결과: 1.6666666666666667

regr_intercept(y, x)

double

입력 값의 선형 회귀 인터셉트를 반환합니다. y는 종속 값이고 x는 독립 값입니다.

SELECT regr_intercept(t.c1, t.c2) FROM (VALUES ((1, 1)), ((2, 2)), ((3, 3)), ((4, 4))) AS t(c1, c2)

예제 결과: 0.0

regr_slope(y, x)

double

입력 값의 선형 회귀 기울기를 반환합니다. y는 종속 값이고 x는 독립 값입니다.

SELECT regr_slope(t.c1, t.c2) FROM (VALUES ((1, 1)), ((2, 2)), ((3, 3)), ((4, 4))) AS t(c1, c2)

예제 결과: 1.0

비뚤어짐(x)

double

모든 입력 값의 왜곡을 반환합니다.

SELECT skewness(t.c1) FROM (VALUES 1, 2, 3, 4, 8) AS t(c1)

예제 결과: 0.8978957037987335

stddev_pop(x)

double

모든 입력 값의 모집단 표준 편차를 반환합니다.

SELECT stddev_pop(t.c1) FROM (VALUES 1, 2, 3, 4, 8) AS t(c1)

예제 결과: 2.4166091947189146

stddev_samp(x) stddev(x)

double

모든 입력 값의 샘플 표준 편차를 반환합니다.

SELECT stddev_samp(t.c1) FROM (VALUES 1, 2, 3, 4, 8) AS t(c1)

예제 결과: 2.701851217221259

var_pop(x)

double

모든 입력 값의 모집단 분산을 반환합니다.

SELECT var_pop(t.c1) FROM (VALUES 1, 2, 3, 4, 8) AS t(c1)

예제 결과: 5.840000000000001

var_samp(x) 분산(x)

double

모든 입력 값의 샘플 분산을 반환합니다.

SELECT var_samp(t.c1) FROM (VALUES 1, 2, 3, 4, 8) AS t(c1)

예제 결과: 7.300000000000001