DETERMINACIÓN DE LAS VARIABLES MÁS DISCRIMINANTES

         Una vez obtenidas las agrupaciones  y elegidas la s agrupaciones de cuatro grupos  por  los métodos de Ward y de la media , se intenta establecer las variables más discriminantes que han establecido dichas clasificaciones . Para ello se realiza un análisis discriminante.

        El método de obtención de las variables más discriminantes que se ha utilizado en éste y otros análisis discriminantes es el algoritmo paso a paso de Wilks , que basándose en sucesivos y simultáneos análisis multivariantes de la varianza nos va generando en cada paso los sucesivos conjuntos de variables que mejor discriminen. En cada paso se planteando la posibilidad de introducir una nueva variable más , o bien de excluir una de las ya consideradas.La primera variable a considerar en el análisis será , obviamente aquella que mejor discrimine la agrupación , lo que se mide a partir del estadístico lambda  de Wilks , o su equivalente F de Snedecor ; y en cada paso la variable sobre la que se considera la posibilidad de su eventual inclusión es también la de mayor poder discriminante de las que resten por introducir . La posibilidad última de entrada de una variable no considerada hasta el momento , y la posibilidad de salida de una de las variables ya consideradas se supedita al valor que tome el estadístico F de cambio (F de entrada y F de salida).Los estadísticos F de entrada y de F de salida nos miden la mejora del poder discriminante al introducir una nueva variable o al excluir una ya considerada. para que una variable pueda ser considerada se le exige que su F de entrada sea elevada y para que se mantenga se le exige , en cada paso , que su F de salida sea también elevada 
        El criterio que se ha utilizado en los cuatro análisis ha sido el exigir a las F de cambio que superar el valor 1 . Además de considerar la posibilidad de introducir o de eliminar , en cada paso una de las variables , el algoritmo controla que en todo momento las variables seleccionadas no produzcan una discriminación redundante ( exigiendo que la correlación multiple no sea excesiva ) . Siguiendo con estas directrices , el proceso se lleva a cabo  paso a paso , replanteándose en cada momento la situación hasta que la mejora de la discriminación no sea posible , ni introduciendo una variable ni eliminando alguna ya introducida.

 

?