mod4

Métodos jerárquicos

En los métodos jerárquicos los individuos no se particionan en clusters de una sola vez, sino que se van haciendo particiones sucesivas a " distintos niveles de agregación o agrupamiento ".

Fundamentalmente, los métodos jerárquicos suelen subdividirse en métodos aglomerativos (ascendentes), que van sucesivamente fusionando grupos en cada paso; y métodos divisivos (descendentes), que van desglosando en grupos cada vez más pequeños el conjunto total de datos.

Nosotros utilizaremos en el desarrollo de nuestro estudio métodos aglomerativos; razón por la cual, dedicaremos más atención a estos métodos.

Cabe concluir, por tanto, que la clusterización jerárquica produce taxones o clusters de diferentes niveles y estructurados de forma ordenada, para ser exactos, estableciendo una "jerarquía"; de ahí su nombre.

Establecer una clasificación jerárquica supone poder realizar una serie de particiones del conjunto de individuos total
W = { i₁ , i₂ , ...,i_N } ; de forma que existan particiones a distintos niveles que vayan agregando (o desagregando, si se trata de un método divisivo) a las particiones de los niveles inferiores .

La representación de la jerarquía de clusters obtenida suele llevarse a cabo por medio de un diagrama en forma de árbol invertido llamado "dendograma", en el que las sucesivas fusiones de las ramas a los distintos niveles nos informan de las sucesivas fusiones de los grupos en grupos de superior nivel (mayor tamaño, menor homogeneidad) sucesivamente:

El nivel de agrupamiento para cada fusión viene dado por un indicador llamado "valor cofenético" que debe ser proporcional a la distancia o disimilaridad considerada en la fusión (distancia de agrupamiento).Esta distancia o disimilaridad considerada en cada fusión estar definida, a veces, entre individuos y, otras, entre clusters; razón por la cual, ser necesario ampliar el concepto de distancia o disimilaridad de acuerdo con algún criterio que nos permita realizar el algoritmo de clasificación.

Una vez completamente definida la distancia para individuos, clusters y cluster-individuo, la clasificación jerárquica se puede llevar a cabo mediante un sencillo algoritmo general :

PASO 1 Formamos la partición inicial:

P = { i₁},{ i₂ },...{ i_N }

considerando cada individuo como un cluster.

PASO 2 Determinamos los dos clusters más próximo (de menor distancia) i_i ,i_j , y los agrupamos en uno solo.

PASO 3 Formamos la partición:

P = { i₁},{ i₂ },...{ i_i u i_j },...,{ i_N }

PASO 4 Repetimos los pasos 2 y 3 hasta obtener la partición final Pr= {W}

Este algoritmo ser esencialmente el mismo para todos los métodos de clasificación jerárquica (ascendente); las diferencias residirán , como ya hemos apuntado y veremos con más detalle, en el criterio de definición de la distancia entre clusters.

Ir a metodos de Análisis Cluster

Ir a Análsis Cluster

cluster