Norma Lp (LP)
A norma Lp (LP) mede a distância da norma p entre as distribuições de facetas dos rótulos observados em um conjunto de dados de treinamento. Essa métrica não é negativa e, portanto, não pode detectar desvios reversos.
A fórmula para a norma Lp é a seguinte:
Lp(Pa, Pd) = (∑y||Pa - Pd||p)1/p
Onde a distância da norma p entre os pontos x e y é definida da seguinte forma:
Lp(x, y) = (|x1-y1|p + |x2-y2|p + … +|xn-yn|p)1/p
A norma 2 é a norma euclidiana. Suponha que você tenha uma distribuição de resultados com três categorias, por exemplo, yi = {y0, y1, y2} = {aceito, na lista de espera, rejeitado} em um cenário multicategórico de admissões em faculdades. Você obtém a soma dos quadrados das diferenças entre as contagens de resultados para as facetas a e d. A distância euclidiana resultante é calculada da seguinte forma:
L2(Pa, Pd) = [(na(0) - nd(0))2 + (na(1) - nd(1))2 + (na(2) - nd(2))2]1/2
Em que:
-
Númeroa(i) é o número dos resultados da i-ésima categoria na faceta a: por exemplo, na(0) é o número de aceitações da faceta a.
-
nd(i) é o número dos resultados da i-ésima categoria na faceta d: por exemplo, nd(2) é o número de rejeições da faceta d.
O intervalo de valores de LP para resultados binários, multicategóricos e contínuos é [0, √2), onde:
-
Valores próximos de zero significam que os rótulos estão distribuídos de forma semelhante.
-
Valores positivos significam que as distribuições dos rótulos divergem; quanto mais positivas, maior a divergência.
-