Lp-norm (LP) - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Lp-norm (LP)

La Lp-norm (LP) misura la distanza p-norm tra le distribuzioni dei facet delle etichette osservate in un set di dati di addestramento. Questa metrica è non negativa e quindi non può rilevare il bias inverso.

La formula per Lp-norm è la seguente:

        Lp(Pa, Pd) = ( ∑y||Pa - Pd||p)1/p

Dove la distanza p-norm tra i punti x e y è definita come segue:

        Lp(x, y) = (|x1-y1|p + |x2-y2|p + … +|xn-yn|p)1/p

2-norm è la norma euclidea. Supponiamo di avere una distribuzione degli esiti con tre categorie, ad esempio yi = {y0, y1, y2} = {accettato, in lista d'attesa, rifiutato} in uno scenario multicategoria di ammissioni all'università. Si calcola la somma dei quadrati delle differenze tra i conteggi degli esiti per i facet a e d. La distanza euclidea risultante viene calcolata come segue:

        L2(Pa, Pd) = [(na(0) - nd(0))2 + (na(1) - nd(1))2 + (na(2) - nd(2))2]1/2

Dove:

  • na(i) è il numero dei risultati della nesima categoria nel facet a: ad esempio na(0) è il numero di accettazioni del facet a.

  • nd(i) è il numero dei risultati della nesima categoria nel facet d: ad esempio nd(2) è il numero di rifiuti del facet d.

    L'intervallo di valori LP per esiti binari, multicategoria e continui è [0, √2), dove:

    • I valori vicini allo zero indicano che le etichette sono distribuite in modo simile.

    • I valori positivi indicano che le distribuzioni delle etichette divergono, più sono positivi e maggiore è la divergenza.