|
|
|
DETERMINACIÓN DE LAS VARIABLES MÁS DISCRIMINANTES
Una vez obtenidas las agrupaciones y elegidas las agrupaciones de cuatro grupos por los métodos de Ward y de la media , se intenta establecer las variables más discriminantes que han establecido dichas clasificaciones . Para ello se realiza un análisis discriminante.
El método de
obtención de las variables más discriminantes que se ha utilizado en éste y
otros análisis discriminantes es el
algoritmo paso
a paso de Wilks , que basándose en sucesivos y simultáneos análisis
multivariantes de la varianza nos va generando en cada paso los sucesivos
conjuntos de variables que mejor discriminen. En cada paso se planteando la
posibilidad de introducir una nueva variable más , o bien de excluir una de las
ya consideradas .La primera variable a considerar en el análisis será ,
obviamente aquella que mejor discrimine la agrupación , lo que se mide a partir
del estadístico lambda de Wilks , o su equivalente F de Snedecor ; y en
cada paso la variable sobre la que se considera la posibilidad de su eventual
inclusión es también la de mayor poder discriminante de las que resten por
introducir . La posibilidad última de entrada de una variable no considerada
hasta el momento , y la posibilidad de salida de una de las variables ya
consideradas se supedita al valor que tome el estadístico F de cambio (F de
entrada y F de salida).Los estadísticos F de entrada y de F de salida nos miden
la mejora del poder discriminante al introducir una nueva variable o al excluir
una ya considerada. para que una variable pueda ser considerada se le exige que
su F de entrada sea elevada y para que se mantenga se le exige , en cada paso ,
que su F de salida sea
también
elevada
El criterio que se ha utilizado en los
cuatro análisis
ha sido el exigir a las F de cambio que superar el valor 1 . Además de
considerar la posibilidad de introducir o de eliminar , en cada paso una de las
variables , el algoritmo controla que en todo momento las variables
seleccionadas no produzcan una discriminación redundante ( exigiendo que la
correlación múltiple no sea excesiva ) . Siguiendo con estas directrices , el
proceso se lleva a cabo paso a paso , replanteándose en cada momento la
situación hasta que la mejora de la discriminación no sea posible , ni
introduciendo una variable ni eliminando alguna ya introducida.