|
|
|
Métodos jerárquicos
En los métodos jerárquicos los individuos no se particionan en clusters de una sola vez, sino que se van haciendo particiones sucesivas a " distintos niveles de agregación o agrupamiento ".
Fundamentalmente, los métodos jerárquicos suelen subdividirse en métodos aglomerativos (ascendentes), que van sucesivamente fusionando grupos en cada paso; y métodos divisivos (descendentes), que van desglosando en grupos cada vez más pequeños el conjunto total de datos.
Nosotros utilizaremos en el desarrollo de nuestro estudio métodos aglomerativos; razón por la cual, dedicaremos más atención a estos métodos.
Cabe concluir, por tanto, que la clusterización jerárquica produce taxones o clusters de diferentes niveles y estructurados de forma ordenada, para ser exactos, estableciendo una "jerarquía"; de ahí su nombre.
Establecer una clasificación jerárquica supone poder realizar una
serie de particiones del conjunto de individuos total
W = { i1 , i2 , ...,iN } ; de forma que existan
particiones a distintos niveles que vayan agregando (o desagregando, si se trata de un
método divisivo) a las particiones de los niveles inferiores .
La representación de la jerarquía de clusters obtenida suele llevarse a cabo por medio de un diagrama en forma de árbol invertido llamado "dendograma", en el que las sucesivas fusiones de las ramas a los distintos niveles nos informan de las sucesivas fusiones de los grupos en grupos de superior nivel (mayor tamaño, menor homogeneidad) sucesivamente:
El nivel de agrupamiento para cada fusión viene dado por un indicador llamado "valor cofenético" que debe ser proporcional a la distancia o disimilaridad considerada en la fusión (distancia de agrupamiento).Esta distancia o disimilaridad considerada en cada fusión estar definida, a veces, entre individuos y, otras, entre clusters; razón por la cual, ser necesario ampliar el concepto de distancia o disimilaridad de acuerdo con algún criterio que nos permita realizar el algoritmo de clasificación.
Una vez completamente definida la distancia para individuos, clusters y cluster-individuo, la clasificación jerárquica se puede llevar a cabo mediante un sencillo algoritmo general :
PASO 1 Formamos la partición inicial:
P = { i1},{ i2 },...{ iN }
considerando cada individuo como un cluster.
PASO 2 Determinamos los dos clusters más próximo (de menor distancia) ii ,ij , y los agrupamos en uno solo.
PASO 3 Formamos la partición:
P = { i1},{ i2 },...{ ii u ij },...,{ iN }
PASO 4 Repetimos los pasos 2 y 3 hasta obtener la partición final Pr= {W}
Este algoritmo ser esencialmente el mismo para todos los métodos de clasificación jerárquica (ascendente); las diferencias residirán , como ya hemos apuntado y veremos con más detalle, en el criterio de definición de la distancia entre clusters.
Ir a metodos de Análisis Cluster