|
|
|
Criterios basados en similaridades. Medidas de similaridad
Para determinar la homogeneidad entre los individuos se puede trabajar con indicadores de su divergencia o disimilaridad, como las distancias que hemos relatado anteriormente; o bien, podemos utilizar indicadores de la similitud.
Si una distancia alta entre individuos nos
indica que son muy diferentes y una baja que son muy similares; los indicadores de
similitud actuar n de manera contraria: conforme aumente su valor, aumentará
la similaridad entre los individuos. Muchos de los indicadores de similitud se basan en
coeficientes de correlación o de asociación.
El coeficiente de correlación de Pearson
se
utiliza, en ocasiones, preferentemente con datos cuantitativos y utilizando el algoritmo
de distancia mínima. Los coeficientes de correlación por rangos de Kendall y Spearman se
utilizan, también, en casos de variables ordinales.
Para variables binarias se utilizan distintos coeficientes de asociación o matching type:
índice binario:
donde m es el número de coincidencias y M el un número total de variables comunes.
índice de Tanimoto
donde h es el número de variables con 1 en los dos individuos y H es el número de variables con algún 1.
y una veintena de indicadores más que no tiene sentido mencionar aquí .