percentileDisc (percentil)
A função percentileDisc
calcula o percentil com base nos números reais em measure
. Ela usa o agrupamento e a classificação aplicados nas fontes do campo. A função percentile
é um alias de percentileDisc
.
Use essa função para responder à seguinte pergunta: quais pontos de dados reais estão presentes nesse percentil? Para retornar o valor do percentil mais próximo que está presente no seu conjunto de dados, use percentileDisc
. Para retornar um valor de percentil exato que talvez não esteja presente no seu conjunto de dados, use percentileCont
.
Sintaxe
percentileDisc(
expression
,percentile
, [group-by level])
Argumentos
- medida
-
Especifica um valor numérico a ser usado para computar o percentil. O argumento deve ser uma medida ou uma métrica. Nulls são ignorados no cálculo.
- percentil
-
O valor do percentil pode ser qualquer constante numérica de 0 a 100. Um valor de percentil 50 calcula o valor médio da medida.
- nível por grupo
-
(Opcional) Especifica o nível pelo qual agrupar a agregação. O nível adicionado pode ser qualquer dimensão ou dimensões, independentemente das dimensões adicionadas ao elemento visual.
O argumento deve ser um campo de dimensão. O nível por grupo deve estar entre colchetes
[ ]
. Para ter mais informações, consulte Funções LAC-A.
Retornos
O resultado da função é um número.
Observações de uso
percentileDisc
é uma função de distribuição inversa que pressupõe um modelo de distribuição discreta. Ela pega um valor percentil e uma especificação de classificação e retorna um elemento do conjunto fornecido.
Para um determinado valor de percentil P
, percentileDisc
usa os valores classificados no elemento visual e retorna o valor com o menor valor de distribuição cumulativa maior ou igual a P
.
Exemplos de percentileDisc
Os exemplos a seguir ajudam a explicar como o percentileDisc funciona.
exemplo Comparar a mediana, percentileDisc
e percentileCont
O exemplo a seguir mostra a mediana de uma dimensão (categoria) usando as funções percentileCont
, percentileDisc
e median
. O valor médio é o mesmo que o valor de percentileCont. percentileCont
interpola um valor, que pode ou não estar no conjunto de dados. No entanto, como percentileDisc
sempre exibe o valor mais próximo que existe no conjunto de dados, os dois resultados podem não corresponder. A última coluna neste exemplo mostra a diferença entre os dois valores. O código para cada campo calculado é o seguinte:
-
50%Cont = percentileCont(
example
, 50 ) -
median = median(
example
) -
50%Disc = percentileDisc(
example
, 50 ) -
Cont-Disc = percentileCont(
example
, 50 ) − percentileDisc(example
, 50 ) -
example = left(
(Para fazer um exemplo mais simples, usamos essa expressão para encurtar os nomes das categorias até a primeira letra.)category
, 1 )
example median 50%Cont 50%Disc Cont-Disc -------- ----------- ------------ -------------- ------------ A 22.48 22.48 22.24 0.24 B 20.96 20.96 20.95 0.01 C 24.92 24.92 24.92 0 D 24.935 24.935 24.92 0.015 E 14.48 14.48 13.99 0.49
exemplo 100º percentil como máximo
O exemplo a seguir mostra uma variedade de valores de percentileDisc
para o campo example
. Os campos calculados n%Disc
são definidos como percentileDisc( {
. Os valores em cada coluna são números reais provenientes do conjunto de dados. example
}
,n)
example 50%Disc 75%Disc 99%Disc 100%Disc -------- ----------- ------------ -------------- ------------ A 20.97 73.98 699.99 6783.02 B 42.19 88.84 820.08 6783.02 C 30.52 90.48 733.44 6783.02 D 41.38 85.99 901.29 6783.0
Você também pode especificar em que nível agrupar a computação usando uma ou mais dimensões na visualização ou no seu conjunto de dados. Isso é chamado de função LAC-A. Para obter mais informações sobre funções LAC-A, consulte Funções LAC-A. O exemplo a seguir calcula o 30º percentil com base em uma distribuição contínua dos números no nível do país, mas não em outras dimensões (região) no elemento visual.
percentile({Sales}, 30, [Country])