Criterios basados en similaridades. Medidas de similaridad

    Para determinar la homogeneidad entre los individuos se puede trabajar con indicadores de su divergencia o disimilaridad, como las distancias que hemos relatado anteriormente; o bien, podemos utilizar indicadores de la similitud.

Si una distancia alta entre individuos nos indica que son muy diferentes y una baja que son muy similares; los indicadores de similitud actuar n de manera contraria: conforme aumente su valor, aumentará  la similaridad entre los individuos. Muchos de los indicadores de similitud se basan en coeficientes de correlación o de asociación.
El coeficiente de correlación de Pearson se utiliza, en ocasiones, preferentemente con datos cuantitativos y utilizando el algoritmo de distancia mínima. Los coeficientes de correlación por rangos de Kendall y Spearman se utilizan, también, en casos de variables ordinales.

Para variables binarias se utilizan distintos coeficientes de asociación o matching type:

    índice binario:

donde m es el número de coincidencias y M el un número total de variables comunes.

    índice de Tanimoto

donde h es el número de variables con 1 en los dos individuos y H es el número de variables con algún 1.

y una veintena de indicadores más que no tiene sentido mencionar aquí .

 

 Ir a medidas de similitud y distancia

 Ir a Análsis Cluster (imprimible)