percentileDisc(백분위수)
percentileDisc
함수는 measure
의 실제 수치를 기반으로 백분위수를 계산합니다. 필드 모음에 적용된 그룹화 및 정렬을 사용합니다. percentile
함수는 percentileDisc
의 별칭입니다.
이 함수를 사용하면 다음 질문에 답할 수 있습니다. 이 백분위수에 있는 실제 데이터 포인트는 무엇입니까? 데이터 세트에 있는 가장 가까운 백분위수 값을 반환하려면 percentileDisc
을(를) 사용하십시오. 데이터 세트에 없을 수도 있는 정확한 백분위수 값을 반환하려면 percentileCont
을(를) 대신 사용하십시오.
구문
percentileDisc(
expression
,percentile
, [group-by level])
인수
- 치수
-
백분위수를 계산하는 데 사용할 숫자 값을 지정합니다. 인수는 치수 또는 지표여야 합니다. 이 계산에서 Null 값은 무시됩니다.
- Percentile
-
백분위수 값은 0~100의 임의의 숫자 상수일 수 있습니다. 50의 백분위 값은 치수의 중간값을 계산합니다.
- 레벨별 그룹
-
(선택 사항) 집계를 그룹화할 수준을 지정합니다. 추가된 수준은 시각적 객체에 추가된 차원과는 별개인 임의의 차원일 수 있습니다.
인수는 차원 필드여야 합니다. 그룹별 레벨은 대괄호
[ ]
(으)로 묶어야 합니다. 자세한 내용은 LAC-A 함수 단원을 참조하십시오.
반환 값
함수의 결과는 숫자입니다.
사용 노트
percentileDisc
는 이산 분포 모델을 가정하는 역분포 함수로서 백분위 값과 정렬 명세를 가지며, 지정된 집합에서 요소를 반환합니다.
지정된 백분위수 값인 P
에 대해 percentileDisc
에서 시각적으로 정렬된 값을 사용하고 누적 분포 값이 가장 작으며 P
보다 크거나 같은 값을 반환합니다.
percentileDisc의 예
다음 예제는 percentileDisc의 작동 방식을 설명하는 데 도움이 됩니다.
예 중앙값, percentileDisc
및 percentileCont
다음 예제에서는 percentileCont
, percentileDisc
, median
함수를 사용하여 차원(범주)의 중앙값을 보여줍니다. 중앙값은 백분위수 값과 동일합니다. percentileCont
값은 데이터 세트에 있을 수도 있고 없을 수도 있는 값을 보간합니다. 하지만 percentileDisc
은(는) 항상 데이터 세트에 있는 값 중 가장 가까운 값을 표시하기 떄문에 두 결과가 일치하지 않을 수 있습니다. 이 예의 마지막 열에는 두 값 간의 차이 일수를 반환합니다. 각 계산된 필드의 코드는 다음과 같습니다.
-
50%Cont = percentileCont(
example
, 50 ) -
median = median(
example
) -
50%Disc = percentileDisc(
example
, 50 ) -
Cont-Disc = percentileCont(
example
, 50 ) − percentileDisc(example
, 50 ) -
example = left(
(더 간단한 예를 만들기 위해 이 표현식을 사용하여 범주 이름을 첫 글자로 줄였습니다.)category
, 1 )
example median 50%Cont 50%Disc Cont-Disc -------- ----------- ------------ -------------- ------------ A 22.48 22.48 22.24 0.24 B 20.96 20.96 20.95 0.01 C 24.92 24.92 24.92 0 D 24.935 24.935 24.92 0.015 E 14.48 14.48 13.99 0.49
예 최대 100번째 백분위수
다음 예제는 example
필드에 대한 percentileDisc
값을 보여 줍니다. 계산된 필드인 n%Disc
은(는) percentileDisc( {
와(과) 같이 정의됩니다. 각 열의 값은 데이터 세트에서 가져온 실제 수입니다.example
}
,n)
example 50%Disc 75%Disc 99%Disc 100%Disc -------- ----------- ------------ -------------- ------------ A 20.97 73.98 699.99 6783.02 B 42.19 88.84 820.08 6783.02 C 30.52 90.48 733.44 6783.02 D 41.38 85.99 901.29 6783.0
또한 뷰 또는 데이터 세트에서 하나 이상의 측정기준을 사용하여 계산을 그룹화할 수준을 지정할 수 있습니다. 이를 LAC-A 함수라고 합니다. LAC-A 함수에 대한 자세한 내용은 LAC-A 함수을(를) 참조하십시오. 다음 예제에서는 30번째 백분위수를 계산하지만 시각적 객체의 다른 차원(리전)에는 적용되지 않고 국가 수준에서의 연속 분포를 기반으로 30번째 백분위수를 계산합니다.
percentile({Sales}, 30, [Country])