PERCENTILE_ fonction CONT de fenêtre - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

PERCENTILE_ fonction CONT de fenêtre

PERCENTILE_ CONT est une fonction de distribution inverse qui suppose un modèle de distribution continue. Elle prend une valeur de centile et une spécification de tri, et renvoie une valeur interpolée qui entre dans la catégorie de la valeur de centile donnée en ce qui concerne la spécification de tri.

PERCENTILE_ CONT calcule une interpolation linéaire entre les valeurs après les avoir ordonnées. A l’aide de la valeur de centile (P) et le nombre de lignes non null (N) dans le groupe d’agrégation, la fonction calcule le nombre de lignes après l’ordonnancement des lignes en fonction de la spécification de tri. Ce nombre de lignes (RN) est calculé selon la formule RN = (1+ (P*(N-1)). Le résultat de la fonction d’agrégation est calculé par interpolation linéaire entre les valeurs des lignes aux numéros de ligne CRN = CEILING(RN) et FRN = FLOOR(RN).

Le résultat final sera le suivant.

Si (CRN = FRN = RN) le résultat est (value of expression from row at RN)

Sinon, le résultat est le suivant :

(CRN - RN) * (value of expression for row at FRN) + (RN - FRN) * (value of expression for row at CRN).

Vous ne pouvez spécifier que la PARTITION clause dans la OVER clause. S'il PARTITION est spécifié, pour chaque ligne, PERCENTILE _ CONT renvoie la valeur qui se situerait dans le percentile spécifié parmi un ensemble de valeurs au sein d'une partition donnée.

Syntaxe

PERCENTILE_CONT ( percentile ) WITHIN GROUP (ORDER BY expr) OVER ( [ PARTITION BY expr_list ] )

Arguments

percentile

Constante numérique comprise entre 0 et 1. Les valeurs NULL sont ignorées dans le calcul.

WITHINGROUP(ORDERPAR expr)

Spécifie les valeurs numériques ou de date/heure au-delà desquelles trier et calculer le centile.

OVER

Spécifie le partitionnement de fenêtrage. La OVER clause ne peut pas contenir d'ordre de fenêtre ni de spécification de cadre de fenêtre.

PARTITIONPAR expr

Argument facultatif qui définit la plage d'enregistrements pour chaque groupe de la OVER clause.

Renvoie

Le type de retour est déterminé par le type de données de l'expression ORDER BY dans la WITHIN GROUP clause. Le tableau suivant indique le type de retour pour chaque type de données d'expression ORDER BY.

Type d’entrée Type de retour
INT2, INT4, INT8, NUMERIC, DECIMAL DECIMAL
FLOAT, DOUBLE DOUBLE
DATE DATE
TIMESTAMP TIMESTAMP

Notes d’utilisation

Si l'expression ORDER BY est un type de DECIMAL données défini avec une précision maximale de 38 chiffres, il est possible que PERCENTILE _ CONT renvoie un résultat inexact ou une erreur. Si la valeur renvoyée par la CONT fonction PERCENTILE _ dépasse 38 chiffres, le résultat est tronqué pour être ajusté, ce qui entraîne une perte de précision. Si, au cours de l’interpolation, un résultat intermédiaire dépasse la précision maximale, un dépassement de capacité numérique se produit et la fonction renvoie une erreur. Pour éviter ces conditions, nous vous recommandons d'utiliser un type de données de moindre précision ou de convertir l'expression ORDER BY en une précision inférieure.

Par exemple, une SUM fonction avec un DECIMAL argument renvoie une précision par défaut de 38 chiffres. L’échelle du résultat est identique à celle de l’argument. Ainsi, par exemple, une colonne SUM d'une DECIMAL (5,2) renvoie un type de données DECIMAL (38,2).

L'exemple suivant utilise une SUM fonction dans la clause ORDER BY d'une CONT fonction PERCENTILE _. Le type de données de la PRICEPAID colonne est DECIMAL (8,2), donc la SUM fonction renvoie DECIMAL (38,2).

select salesid, sum(pricepaid), percentile_cont(0.6) within group (order by sum(pricepaid) desc) over() from sales where salesid < 10 group by salesid;

Pour éviter une perte de précision potentielle ou une erreur de débordement, convertissez le résultat en un type de DECIMAL données de moindre précision, comme le montre l'exemple suivant.

select salesid, sum(pricepaid), percentile_cont(0.6) within group (order by sum(pricepaid)::decimal(30,2) desc) over() from sales where salesid < 10 group by salesid;

Exemples

Les exemples suivants utilisent le WINSALES tableau. Pour une description du WINSALES tableau, voirExemple de tableau contenant des exemples de fonctions de fenêtrage.

select sellerid, qty, percentile_cont(0.5) within group (order by qty) over() as median from winsales; sellerid | qty | median ----------+-----+-------- 1 | 10 | 20.0 1 | 10 | 20.0 3 | 10 | 20.0 4 | 10 | 20.0 3 | 15 | 20.0 2 | 20 | 20.0 3 | 20 | 20.0 2 | 20 | 20.0 3 | 30 | 20.0 1 | 30 | 20.0 4 | 40 | 20.0 (11 rows)
select sellerid, qty, percentile_cont(0.5) within group (order by qty) over(partition by sellerid) as median from winsales; sellerid | qty | median ----------+-----+-------- 2 | 20 | 20.0 2 | 20 | 20.0 4 | 10 | 25.0 4 | 40 | 25.0 1 | 10 | 10.0 1 | 10 | 10.0 1 | 30 | 10.0 3 | 10 | 17.5 3 | 15 | 17.5 3 | 20 | 17.5 3 | 30 | 17.5 (11 rows)

L'exemple suivant calcule les PERCENTILE _ CONT et PERCENTILE _ DISC des ventes de billets pour les vendeurs de l'État de Washington.

SELECT sellerid, state, sum(qtysold*pricepaid) sales, percentile_cont(0.6) within group (order by sum(qtysold*pricepaid::decimal(14,2) ) desc) over(), percentile_disc(0.6) within group (order by sum(qtysold*pricepaid::decimal(14,2) ) desc) over() from sales s, users u where s.sellerid = u.userid and state = 'WA' and sellerid < 1000 group by sellerid, state; sellerid | state | sales | percentile_cont | percentile_disc ----------+-------+---------+-----------------+----------------- 127 | WA | 6076.00 | 2044.20 | 1531.00 787 | WA | 6035.00 | 2044.20 | 1531.00 381 | WA | 5881.00 | 2044.20 | 1531.00 777 | WA | 2814.00 | 2044.20 | 1531.00 33 | WA | 1531.00 | 2044.20 | 1531.00 800 | WA | 1476.00 | 2044.20 | 1531.00 1 | WA | 1177.00 | 2044.20 | 1531.00 (7 rows)