DETERMINACION DE LAS VARIABLES MAS DISCRIMINANTES

Como se ha comentado, uno de los objetivos de la discriminación descriptiva es determinar cuáles son , de entre las variables disponibles, aquellas que tienen un mayor poder discriminativo. Es evidente que este objetivo es tanto más importante si el número de variable de las que se dispone información es muy elevado o si este número excede al número máximo de variables que pueden utilizarse en una factorización posterior.

Determinar qué variable es más discriminante y las que tienen, sucesivamente, mayor poder discriminativo puede hacerse a partir de un análisis de la varianza (univariante) para cada variable; obteniendo que una variable es tanto más discriminativa cuanto mayor sea su estadístico F.

Si queremos determinar qué grupos de variables de un determinado tamaño es el más discriminativo, podemos considerar todos los posibles grupos de ese tamaño y realizar un análisis MANOVA , decantándonos por el grupo de variables que presente un menor valor de su estadístico L de Wilks.

Procediendo de esta manera, podemos, desgraciadamente, acabar seleccionando un conjunto de variables que resulten estar altamente correlacionadas entre sí, proporcionándonos, en consecuencia, una discriminación redundante. Para evitar este problema, los distintos algoritmos de discriminación "paso-a-paso " utilizan "criterios de tolerancia" para la selección de las variables como variables discriminantes

De todas manera, la determinación del conjunto de variables a considerar como variables discriminantes es, en la práctica, algo que se realiza a la vez que la determinación de los factores o ejes discriminantes utilizando los ya mencionados procedimientos paso a paso.

Especialmente nos centraremos en el procedimiento de selección y discriminación basado en la mínimización del estadístico L de Wilks, que es el que utilizaremos en nuestro estudio

 

Ir al Análisis factorial Discriminante

Ir a discriminante

 

 

 

 

 

 

 

 

 

c