DISTANCIA EUCLIDEA NORMALIZADA

La distancia euclídea normalizada entre los individuos i y j la definiremos como :

d (i,j)= (Wi - Wj)' S-1 (Wi - Wj)

Donde S es una matriz diagonal con las varianzas en su diagonal principal y ceros en el resto de sus elementos.
Obviamente S-1 será su inversa: la matriz diagonal que tendrá los valores recíprocos de las varianzas en su diagonal.

Utilizar como matriz de la forma cuadrática distancia la matriz S-1 , en vez de la matriz identidad, I, es, claramente, equivalente a utilizar como valores de partida los valores de las variables cambiados de escala a la desviación típica de las variables.

Empleando este tipo de distancia solventamos el inconveniente de los efectos de unidades de medida distintas de las variables y obtenemos una distancia que no dependerá de las unidades de medida.

Sin embargo, la alta correlación entre algunas variables puede seguir siendo un grave inconveniente.

Ir a medidas de similitud y distancia

 Ir a Análsis Cluster (imprimible)