L_p-norm (LP)

La L_p-norm (LP) misura la distanza p-norm tra le distribuzioni dei facet delle etichette osservate in un set di dati di addestramento. Questa metrica è non negativa e quindi non può rilevare il bias inverso.

La formula per L_p-norm è la seguente:

L_p(P_a, P_d) = ( ∑_y||P_a - P_d||^p)^1/p

Dove la distanza p-norm tra i punti x e y è definita come segue:

L_p(x, y) = (|x₁-y₁|^p + |x₂-y₂|^p + … +|x_n-y_n|^p)^1/p

2-norm è la norma euclidea. Supponiamo di avere una distribuzione degli esiti con tre categorie, ad esempio y_i = {y₀, y₁, y₂} = {accettato, in lista d'attesa, rifiutato} in uno scenario multicategoria di ammissioni all'università. Si calcola la somma dei quadrati delle differenze tra i conteggi degli esiti per i facet a e d. La distanza euclidea risultante viene calcolata come segue:

L₂(P_a, P_d) = [(n_a⁽⁰⁾ - n_d⁽⁰⁾)² + (n_a⁽¹⁾ - n_d⁽¹⁾)² + (n_a⁽²⁾ - n_d⁽²⁾)²]^1/2

Dove:

n_a⁽ⁱ⁾ è il numero dei risultati della nesima categoria nel facet a: ad esempio n_a⁽⁰⁾ è il numero di accettazioni del facet a.
n_d⁽ⁱ⁾ è il numero dei risultati della nesima categoria nel facet d: ad esempio n_d⁽²⁾ è il numero di rifiuti del facet d.

L'intervallo di valori LP per esiti binari, multicategoria e continui è [0, √2), dove:
- I valori vicini allo zero indicano che le etichette sono distribuite in modo simile.
- I valori positivi indicano che le distribuzioni delle etichette divergono, più sono positivi e maggiore è la divergenza.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Divergenza Jensen-Shannon (JS)

Distanza di variazione totale (TVD)

Lp-norm (LP)

L_p-norm (LP)