Medidas de similitud y distancia entre grupos
DISTANCIA MINIMA (NEAREST NEIGHBOUR DISTANCE)
DISTANCIA MAXIMA (FURTHEST NEIGHBOUR DISTANCE)
DISTANCIA ENTRE CENTROIDES
La aplicación del análisis cluster requiere, por lo general, no sólo el cálculo de las distancias o similitudes entre los individuos iniciales, sino, también la determinación de las distancias o similaridades entre los grupos y/o entre un grupo y un individuo.
Esta necesidad de determinar las distancias o similaridades entre grupos es especialmente importante en los métodos jerárquico s, como se ver más tarde.
Hay varias alternativas diferentes para definir la distancia entre grupos:
DISTANCIA MINIMA (NEAREST NEIGHBOUR DISTANCE)
Podemos definir la distancia entre un grupo y un individuo como la menor de las distancias entre los individuos del grupo y el individuo exterior considerado.
Si llamamos I al grupo formado por los individuos (i1 , i2 ,... ii ) y j al individuo exterior, definiremos, entonces, la distancia entre I y j como: D (I,j) = min D (i , j)
Análogamente, siguiendo este criterio, puede definirse la distancia entre dos grupos I = { i1 , i2 ,... ii } y J = { j1 , j2 ,... jj }, como la mínima de las distancias entre un individuo de I y otro de J: D (I,J) = min D (i ,j )
Como veremos, la distancia mínima será la utilizada en el algoritmo jerárquico de clasificación conocido como método de la distancia mínima o single linkage.
DISTANCIA MAXIMA (FURTHEST NEIGHBOUR DISTANCE)
También podemos definir la distancia entre un grupo I y un individuo j como el valor máximo de las distancias entre j y los individuos de I; esto es:D (I,j) = max D (i , j)
Y, la distancia entre dos grupos, I y J, análogamente, sería : D (I,J) = max D (i , j )
Esta distancia ser la utilizada en el método o algoritmo de la distancia máxima o complete linkage.
También se puede definir la distancia entre el grupo I y el individuo j como la distancia entre el centroide o centro de gravedad de I y j. Si i es el centro de gravedad de I, tendremos que: D(I,j) = D (i, j)
Y de la misma manera la distancia entre dos grupos I y J nos
vendrá dada por la distancia entre sus centroides:
D (I,J) = D (i, j )
Estas y otras definiciones de distancias entre grupos serán utilizadas como criterios a emplear en los distintos algoritmos de clasificación
Por lo que hace a los indicadores de similaridad, algunos criterios se han dado para la definición de la similaridad entre grupos. Así, por ejemplo, Lance y Williams proponen como similaridad entre los grupos I y J :