DETERMINACIÓN DE LAS RAZONES DE LA AGRUPACIÓN-DISCRIMINACIÓN DE LAS AGRUPACIONES PARA LA ESTRUCTURA ECONÓMICA

 

DETERMINACIÓN DE LAS VARIABLES MÁS DISCRIMINANTES

 

     Una vez obtenidas las agrupaciones  y elegidas las agrupaciones de cuatro grupos  por  los métodos de Ward y de la media , se intenta establecer las variables más discriminantes que han establecido dichas clasificaciones . Para ello se realiza un análisis discriminante.

    El método de obtención de las variables más discriminantes que se ha utilizado en éste y otros análisis discriminantes es el algoritmo paso a paso de Wilks , que basándose en sucesivos y simultáneos análisis multivariantes de la varianza nos va generando en cada paso los sucesivos conjuntos de variables que mejor discriminen. En cada paso se planteando la posibilidad de introducir una nueva variable más , o bien de excluir una de las ya consideradas .La primera variable a considerar en el análisis será , obviamente aquella que mejor discrimine la agrupación , lo que se mide a partir del estadístico lambda  de Wilks , o su equivalente F de Snedecor ; y en cada paso la variable sobre la que se considera la posibilidad de su eventual inclusión es también la de mayor poder discriminante de las que resten por introducir . La posibilidad última de entrada de una variable no considerada hasta el momento , y la posibilidad de salida de una de las variables ya consideradas se supedita al valor que tome el estadístico F de cambio (F de entrada y F de salida).Los estadísticos F de entrada y de F de salida nos miden la mejora del poder discriminante al introducir una nueva variable o al excluir una ya considerada. para que una variable pueda ser considerada se le exige que su F de entrada sea elevada y para que se mantenga se le exige , en cada paso , que su F de salida sea también elevada 
El criterio que se ha utilizado en los cuatro análisis ha sido el exigir a las F de cambio que superar el valor 1 . Además de considerar la posibilidad de introducir o de eliminar , en cada paso una de las variables , el algoritmo controla que en todo momento las variables seleccionadas no produzcan una discriminación redundante ( exigiendo que la correlación múltiple no sea excesiva ) . Siguiendo con estas directrices , el proceso se lleva a cabo  paso a paso , replanteándose en cada momento la situación hasta que la mejora de la discriminación no sea posible , ni introduciendo una variable ni eliminando alguna ya introducida.

 

DETERMINACION DE LAS VARIABLES DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO  U.P.G.M.A.

    Para conseguir las variables más discriminantes de las 33 con las que se está realizando el análisis de la estructura económica del A.M.de .V se parte , como ya se ha dicho de las puntuaciones de la lambda de Wilks y F de Snedecor . Se observa que todas las variables tienen un valor alto (superior a 1 )

    Tras la aplicación del algoritmo paso a paso de Wilks  ya descrito  ,  y en base a las MANOVAS realizados se llega a la conclusión de la existencia de 30 variables discriminantes de la agrupación en cuatro clusters realizada por el método de la media (U.P.G.M.A.) . Su número en relación al primario , es decir a las 33 variables iniciales  , es muy alto. Intentar interpretar las diferencias entre grupos no supondría algo muy distinto de lo que se interpretó con los valores para cada grupo y para todas las variables , de ahí  , que nos remitamos a esa interpretación ,sin proceder a la específica para las 30 variables más discriminantes .

 

DETERMINACIÓN DE LAS FUNCIONES MÁS DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A.

Una vez seleccionadas las 30 variables más discriminantes de las utilizadas para el análisis económico , el análisis discriminante se completa con la determinación de unas nuevas variables "inobservables" , que sean capaces de discriminar óptimamente los grupos . Estas nuevas variables son , por construcción , funciones de las variables más discriminantes obtenidas  , son combinaciones lineales de ellas , su número , generalmente inferior , es el número de grupos menos una unidad  ( en nuestro caso 3) , y tienen la propiedad de ser los ejes de discriminación óptima en el sentido de ser las combinaciones lineales de las "variables discriminantes" que maximizan la varianza entre clusters , al tiempo que hacen mínima la varianza interna de cada cluster o grupo.

Estas variables , llamadas , funciones canónicas , factores o ejes discriminantes , se obtienen por factorización de las variables más discriminantes . Esta factorización nos ofrece la relación funcional lineal entre las variables y los factores , que vendrá dada por la llamada matriz de coeficientes o "patrón discriminante" . partiendo de esta matriz de coeficientes puede evaluarse para cada municipio el valor que toma cada factor discriminantes ( sus puntuaciones discriminantes ) , de forma análoga a como ocurría en el análisis factorial . También de forma análoga al análisis factorial , podrá utilizarse esta matriz de coeficientes , juntamente con las correlaciones entre factores y variables  (matriz de estructura) para interpretar los factores discriminantes y poder concluir algunas razones teóricas para las diferencias entre grupos de la agrupación establecida.

De esta manera para la agrupación en cuatro que nos ocupa se calcula su matriz de coeficientes mediante el programa SPSS . En dicha matriz se observan las puntuaciones de las 30 variables más discriminantes obtenidas en relación a las tres funciones discriminantes . Es decir " el peso " positivo o negativo que tienen dichas variables en una determinada función de las tres .

Se realiza  y concreta despúes  la matriz de la estructura discriminante en ella se aprecian las correlaciones de las 33 variables  económicas originales respecto a los tres factores-funciones  propuestos. Se encuentran ordenadas en cuanto a "significación" por y para cada una de las  tres funciones.

Por último se establecen los valores medios de cada uno de los cuatro clusters respecto a los tres factores discriminantes . En dicha tabla  se observa el "peso" que cada factor-función  tiene en cada uno de los grupos.

En base a estas tres matrices-tablas es posible intentar interpretar teóricamente las diferencias entre los grupos de la agrupación en cuatro , en base a los tres factores-funciones  obtenidas.

Antes de pasar a dicha interpretación puede comprobarse la similitud entre  la clasificación (clusterización) obtenida con las funciones discriminantes y la anteriormente obtenida con el análisis cluster que hemos realizado en base a las variables originales y concretamente en este caso por el método de la media. En dicha reclasificación se observa que el nivel de coincidencia es del 100 %  . Las diferencias entre los  cuatro grupos creados de una u otra manera  es simplemente ninguna

INTERPRETACIÓN DE LAS FUNCIONES DISCRIMINANTES DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A PARA EL ANÁLISIS ECONÓMICO.

 En base a la matriz de estructura ,  y la matriz de valores medios  es posible aventurar alguna interpretación de la estructura discriminante de los factores .

En base a la matriz de estructura , se puede establecer que :

El primer factor supone la   falta ( correlación negativa ) de actividad . La actividad económica de cualquier tipo es inferior a su potencial por población

El segundo factor supone el consumo de grandes cantidades de energía industrial

El tercer factor supone  nivel económico alto , gran consumo de energía doméstica y tasa de actividad en servicios.

Observado la matriz de valores medios y relacionando éstos con la características aventuradas para cada factor  podemos interpretar las características de cada grupo.

El primero de los grupos del cluster en cuatro tiene valor medio positivo respecto al primer factor y negativo los dos restantes ( más el segundo que el tercero) . El gran grupo se plantea como municipios por debajo de sus "posibilidades" económicas potenciales , con escasa industrialización y nivel económico bajo.

El segundo de los grupos con una influencia mayor positiva del segundo factor , algo negativa del tercero y también positiva (menos valor que el segundo factor) en el primero , se postula como un grupo claramente industrial en donde el resto de actividad económica está por debajo de su potencial por población y en donde el nivel económico no es bajo .

El tercero de los grupos tiene un valor positivo para  las tres funciones si  bien para la tercera este valor es mayor . Así las cosas podríamos hablar de municipios en los que el nivel económico es alto y el consumo de energía doméstica también lo es .Por otro lado la población se decanta por la actividad en servicios y la actividad económica está por debajo de lo potencialmente posible  ( valor positivo y alto del primer factor).

El cuarto de los grupos , recordemos que solo lo forma la ciudad de Valencia , tiene un valor elevadísimo para el primer factor-función  , si bien en sentido negativo . Este elevado valor deja sin influencia a los otros dos . Estaríamos hablando de un grupo-municipio en el que la actividad económica de cualquier tipo ( excepto industria) está por encima de su potencial por población.

Pueden comprobarse las coincidencias entre la interpretación que se acaba de realizar y la  establecida partiendo de los valores de las variables económicas   para los grupos de municipios. Las diferencias son mínimas.

 

DETERMINACION DE LAS VARIABLES DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO  WARD.

   

    Para conseguir las variables más discriminantes de las 33 con las que se está realizando el análisis de la estructura económica  del Área Metropolitana de Valencia se parte , como ya se ha dicho ,  de las puntuaciones de la lambda de Wilks y F de Snedecor . Se observa que todas las variables tienen un valor alto ;superior a uno

    Tras la aplicación del algoritmo paso a paso de Wilks  ya descrito  ,  y en base a las MANOVAS realizados se llega a la conclusión de la existencia de 27 variables discriminantes de la agrupación en cuatro clusters realizada por el método de  Ward. Su número en relación al primario , es decir a las 33 variables iniciales  , es muy alto. Intentar interpretar las diferencias entre grupos no supondría algo muy distinto de lo que se interpretó con los valores para cada grupo y para todas las variables , de ahí  , que nos remitamos a esa interpretación ,sin proceder a la específica para las 27 variables más discriminantes .

 

DETERMINACIÓN DE LAS FUNCIONES MÁS DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO WARD.

Una vez encontradas  las 27 variables más discriminantes de las utilizadas para el análisis económico , el análisis discriminante se completa con la determinación de unas nuevas variables "inobservables" , que sean capaces de discriminar óptimamente los grupos . Estas nuevas variables son , por construcción , funciones de las variables más discriminantes obtenidas  , son combinaciones lineales de ellas , su número , generalmente inferior , es el número de grupos menos una unidad  ( en nuestro caso 3) , y tienen la propiedad de ser los ejes de discriminación óptima en el sentido de ser las combinaciones lineales de las "variables discriminantes" que maximizan la varianza entre clusters , al tiempo que hacen mínima la varianza interna de cada cluster o grupo.

Estas variables , llamadas , funciones canónicas , factores o ejes discriminantes , se obtienen por factorización de las variables más discriminantes . Esta factorización nos ofrece la relación funcional lineal entre las variables y los factores , que vendrá dada por la llamada matriz de coeficientes o "patrón discriminante" . partiendo de esta matriz de coeficientes puede evaluarse para cada municipio el valor que toma cada factor discriminantes ( sus puntuaciones discriminantes ) , de forma análoga a como ocurría en el análisis factorial . También de forma análoga al análisis factorial , podrá utilizarse esta matriz de coeficientes , juntamente con las correlaciones entre factores y variables  (matriz de estructura) para interpretar los factores discriminantes y poder concluir algunas razones teóricas para las diferencias entre grupos de la agrupación establecida.

De esta manera para la agrupación en cuatro que nos ocupa se calcula su matriz de coeficientes mediante el programa SPSS . En dicha matriz se observan las puntuaciones de las 27 variables más discriminantes obtenidas en relación a las tres funciones discriminantes . Es decir " el peso " positivo o negativo que tienen dichas variables en una determinada función de las tres .

Se realiza  y concreta después  la matriz de la estructura discriminante en ella se aprecian las correlaciones de las 33 variables  económicas originales respecto a los tres factores propuestos. Se encuentran ordenadas en cuanto a "significación" por y para cada una de las  tres funciones.

Por último se establecen los valores medios de cada uno de los cuatro clusters respecto a los tres factores discriminantes . En dicha tabla  se observa el "peso" que cada factor-función  tiene en cada uno de los grupos.

En base a estas tres matrices-tablas es posible intentar interpretar teóricamente las diferencias entre los grupos de la agrupación en cuatro , en base a los tres factores-funciones  obtenidas.

Antes de pasar a dicha interpretación puede comprobarse la similitud entre  la clasificación (clusterización) obtenida con las funciones discriminantes y la anteriormente obtenida con el análisis cluster que hemos realizado en base a las variables originales y concretamente en este caso por el método de la media. En dicha reclasificación se observa que el nivel de coincidencia se establece en el 98,3 % lo que evidentemente no es nada despreciable . Las diferencias entre los  cuatro grupos creados de una u otra manera radica en la ubicación del municipio de Almassera que en la agrupación original estaba en el tercero de los grupos y ahora y con la aplicación de las funciones discriminantes pasa a localizarse en el grupo primero.

 

INTERPRETACIÓN DE LAS FUNCIONES DISCRIMINANTES DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO WARD  PARA EL ANÁLISIS ECONÓMICO.

 En base a la matriz de estructura ,  y  a la matriz de valores medios  es posible aventurar alguna interpretación de la estructura discriminante de los factores . Si bien algunas funciones  tienen pocas variables con las que su  correlación sea significativa , lo que dificulta interpretar las sus características y por tanto las características del grupo.

En base a la matriz de estructura , se puede establecer que :

El primer factor-función tiene  correlaciones positivas con los indicadores de actividad por superfice, supone concentración espacial de actividad económica.

La segunda función establece correlaciones positivas con el nivel económico , con el consumo de energía doméstica , y con los índices o indicadores económicos

El tercer factor-función mantiene correlaciones positivas y significativas con las diversas tasas de actividad

Observado la matriz de valores medios y relacionando éstos con la características aventuradas para cada factor  podemos interpretar las características de cada grupo.

El primero de los grupos del cluster en cuatro tiene valores negativos para la primera  y segunda función en términos cuantitativos parecidos, por otro lado tiene correlación positiva , también en parecido valor , con el tercero. Podríamos hablar , por tanto  ,de un grupo de municipios  con bajo nivel económico , baja actividad económica es su espacio pero alta tasa de actividad entre su población .Serían municipios cuya población con bajo nivel económico trabaja en otros.

El segundo de los grupos con correlación  claramente positiva con el segundo de los factores-funciones y algo negativa con los otros dos , podría definirse como un grupo en el que el nivel económico es alto , el consumo de energía doméstica también y la actividad económica se ajusta a sus potenciales .

El tercero de los grupos tiene una correlación negativa con los tres grupos principalmente con el tercero lo que podría indicarnos que los municipios de este grupo poseen escasa tasa de actividad y actividad económica

El cuarto de los grupos tiene valor positivo para el primero de los factores y casi 0 para el resto . Son municipios en los que existe congestión de actividad económica lo que no se traduce en un alto nivel económico.

Pueden comprobarse    las coincidencias entre la interpretación que se acaba de realizar y la  establecida partiendo de los valores de las variables económicas para los grupos de municipios. Las diferencias son mínimas , como ocurre  en la interpretación para las funciones discriminantes en el caso de la utilización del método de la media U.P.G.M.A.,

 

?