Medidas de similitud y distancia entre grupos

 DISTANCIA MINIMA (NEAREST NEIGHBOUR DISTANCE)
                DISTANCIA MAXIMA (FURTHEST NEIGHBOUR DISTANCE)
                DISTANCIA ENTRE CENTROIDES

 Ir a Análsis Cluster

La aplicación del análisis cluster requiere, por lo general, no sólo el cálculo delas distancias o similitudes entre los individuos iniciales, sino, también la determinación de las distancias o similaridades entre los grupos y/o entre un grupo y un individuo.

Esta necesidad de determinar las distancias o similaridades entre grupos es especialmente importante en los métodos jerárquico s, como se ver  más  tarde.

Hay varias alternativas diferentes para definir la distancia entre grupos:

 

 

 

 

DISTANCIA MINIMA (NEAREST NEIGHBOUR DISTANCE)

Podemos definir la distancia entre un grupo y un individuo como la menor de las distancias entre los individuos del grupo y el individuo exterior considerado.

Si llamamos I al grupo formado por los individuos (i1 , i2 ,... ii ) y j al individuo exterior, definiremos, entonces, la distancia entre I y j como:    D (I,j) = min D (i , j)

Análogamente, siguiendo este criterio, puede definirse la distancia entre dos grupos I = { i1 , i2 ,... ii } y J = { j1 , j2 ,... jj }, como la mínima de las distancias entre un individuo de I y otro de J: D (I,J) = min D (i ,j )

Como veremos, la distancia mínima será  la utilizada en el algoritmo jerárquico de clasificación conocido como método de la distancia mínima o single linkage.

 

DISTANCIA MAXIMA (FURTHEST NEIGHBOUR DISTANCE)

También podemos definir la distancia entre un grupo I y un individuo j como el valor máximo de las distancias entre j y los individuos de I; esto es:D (I,j) = max D (i , j)

Y, la distancia entre dos grupos, I y J, análogamente, sería :  D (I,J) = max D (i , j )

Esta distancia ser  la utilizada en el método o algoritmo de la distancia máxima o complete linkage.

 

DISTANCIA ENTRE CENTROIDES

También se puede definir la distancia entre el grupo I y el individuo j como la distancia entre el centroide o centro de gravedad de I y j. Si i es el centro de gravedad de I, tendremos que: D(I,j) = D (i, j)

Y de la misma manera la distancia entre dos grupos I y J nos vendrá  dada por la distancia entre sus centroides:
D (I,J) = D (i, j )

Estas y otras definiciones de distancias entre grupos serán utilizadas como criterios a emplear en los distintos algoritmos de clasificación

Por lo que hace a los indicadores de similaridad, algunos criterios se han dado para la definición de la similaridad entre grupos. Así, por ejemplo, Lance y Williams proponen como similaridad entre los grupos I y J :