|
|
|
DETERMINACIÓN DE LAS RAZONES DE LA AGRUPACIÓN-DISCRIMINACIÓN DE LAS AGRUPACIONES PARA LA ESTRUCTURA ECONÓMICA
DETERMINACIÓN DE LAS VARIABLES MÁS DISCRIMINANTES
Una vez obtenidas las agrupaciones y elegidas las agrupaciones de cuatro grupos por los métodos de Ward y de la media , se intenta establecer las variables más discriminantes que han establecido dichas clasificaciones . Para ello se realiza un análisis discriminante.
El método de
obtención de las variables más discriminantes que se ha utilizado en éste y
otros análisis discriminantes es el
algoritmo paso
a paso de Wilks , que basándose en sucesivos y simultáneos análisis
multivariantes de la varianza nos va generando en cada paso los sucesivos
conjuntos de variables que mejor discriminen. En cada paso se planteando la
posibilidad de introducir una nueva variable más , o bien de excluir una de las
ya consideradas .La primera variable a considerar en el análisis será ,
obviamente aquella que mejor discrimine la agrupación , lo que se mide a partir
del estadístico lambda de Wilks , o su equivalente F de Snedecor ; y en
cada paso la variable sobre la que se considera la posibilidad de su eventual
inclusión es también la de mayor poder discriminante de las que resten por
introducir . La posibilidad última de entrada de una variable no considerada
hasta el momento , y la posibilidad de salida de una de las variables ya
consideradas se supedita al valor que tome el estadístico F de cambio (F de
entrada y F de salida).Los estadísticos F de entrada y de F de salida nos miden
la mejora del poder discriminante al introducir una nueva variable o al excluir
una ya considerada. para que una variable pueda ser considerada se le exige que
su F de entrada sea elevada y para que se mantenga se le exige , en cada paso ,
que su F de salida sea
también
elevada
El criterio que se ha utilizado en los
cuatro análisis
ha sido el exigir a las F de cambio que superar el valor 1 . Además de
considerar la posibilidad de introducir o de eliminar , en cada paso una de las
variables , el algoritmo controla que en todo momento las variables
seleccionadas no produzcan una discriminación redundante ( exigiendo que la
correlación múltiple no sea excesiva ) . Siguiendo con estas directrices , el
proceso se lleva a cabo paso a paso , replanteándose en cada momento la
situación hasta que la mejora de la discriminación no sea posible , ni
introduciendo una variable ni eliminando alguna ya introducida.
DETERMINACION DE LAS VARIABLES DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A.
Para conseguir las variables más discriminantes de las 33 con las que se está realizando el análisis de la estructura económica del A.M.de .V se parte , como ya se ha dicho de las puntuaciones de la lambda de Wilks y F de Snedecor . Se observa que todas las variables tienen un valor alto (superior a 1 )
Tras la aplicación del algoritmo paso a paso de Wilks ya descrito , y en base a las MANOVAS realizados se llega a la conclusión de la existencia de 30 variables discriminantes de la agrupación en cuatro clusters realizada por el método de la media (U.P.G.M.A.) . Su número en relación al primario , es decir a las 33 variables iniciales , es muy alto. Intentar interpretar las diferencias entre grupos no supondría algo muy distinto de lo que se interpretó con los valores para cada grupo y para todas las variables , de ahí , que nos remitamos a esa interpretación ,sin proceder a la específica para las 30 variables más discriminantes .
DETERMINACIÓN DE LAS FUNCIONES MÁS DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A.
Una vez seleccionadas las 30 variables más discriminantes de las utilizadas para el análisis económico , el análisis discriminante se completa con la determinación de unas nuevas variables "inobservables" , que sean capaces de discriminar óptimamente los grupos . Estas nuevas variables son , por construcción , funciones de las variables más discriminantes obtenidas , son combinaciones lineales de ellas , su número , generalmente inferior , es el número de grupos menos una unidad ( en nuestro caso 3) , y tienen la propiedad de ser los ejes de discriminación óptima en el sentido de ser las combinaciones lineales de las "variables discriminantes" que maximizan la varianza entre clusters , al tiempo que hacen mínima la varianza interna de cada cluster o grupo.
Estas variables , llamadas , funciones canónicas , factores o ejes discriminantes , se obtienen por factorización de las variables más discriminantes . Esta factorización nos ofrece la relación funcional lineal entre las variables y los factores , que vendrá dada por la llamada matriz de coeficientes o "patrón discriminante" . partiendo de esta matriz de coeficientes puede evaluarse para cada municipio el valor que toma cada factor discriminantes ( sus puntuaciones discriminantes ) , de forma análoga a como ocurría en el análisis factorial . También de forma análoga al análisis factorial , podrá utilizarse esta matriz de coeficientes , juntamente con las correlaciones entre factores y variables (matriz de estructura) para interpretar los factores discriminantes y poder concluir algunas razones teóricas para las diferencias entre grupos de la agrupación establecida.
De esta manera para la agrupación en cuatro que nos ocupa se calcula su matriz de coeficientes mediante el programa SPSS . En dicha matriz se observan las puntuaciones de las 30 variables más discriminantes obtenidas en relación a las tres funciones discriminantes . Es decir " el peso " positivo o negativo que tienen dichas variables en una determinada función de las tres .
Se realiza y concreta despúes la matriz de la estructura discriminante en ella se aprecian las correlaciones de las 33 variables económicas originales respecto a los tres factores-funciones propuestos. Se encuentran ordenadas en cuanto a "significación" por y para cada una de las tres funciones.
Por último se establecen los valores medios de cada uno de los cuatro clusters respecto a los tres factores discriminantes . En dicha tabla se observa el "peso" que cada factor-función tiene en cada uno de los grupos.
En base a estas tres matrices-tablas es posible intentar interpretar teóricamente las diferencias entre los grupos de la agrupación en cuatro , en base a los tres factores-funciones obtenidas.
Antes de pasar a dicha interpretación puede comprobarse la similitud entre la clasificación (clusterización) obtenida con las funciones discriminantes y la anteriormente obtenida con el análisis cluster que hemos realizado en base a las variables originales y concretamente en este caso por el método de la media. En dicha reclasificación se observa que el nivel de coincidencia es del 100 % . Las diferencias entre los cuatro grupos creados de una u otra manera es simplemente ninguna
INTERPRETACIÓN DE LAS FUNCIONES DISCRIMINANTES DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A PARA EL ANÁLISIS ECONÓMICO.
En base a la matriz de estructura , y la matriz de valores medios es posible aventurar alguna interpretación de la estructura discriminante de los factores .
En base a la matriz de estructura , se puede establecer que :
El primer factor supone la falta ( correlación negativa ) de actividad . La actividad económica de cualquier tipo es inferior a su potencial por población
El segundo factor supone el consumo de grandes cantidades de energía industrial
El tercer factor supone nivel económico alto , gran consumo de energía doméstica y tasa de actividad en servicios.
Observado la matriz de valores medios y relacionando éstos con la características aventuradas para cada factor podemos interpretar las características de cada grupo.
El primero de los grupos del cluster en cuatro tiene valor medio positivo respecto al primer factor y negativo los dos restantes ( más el segundo que el tercero) . El gran grupo se plantea como municipios por debajo de sus "posibilidades" económicas potenciales , con escasa industrialización y nivel económico bajo.
El segundo de los grupos con una influencia mayor positiva del segundo factor , algo negativa del tercero y también positiva (menos valor que el segundo factor) en el primero , se postula como un grupo claramente industrial en donde el resto de actividad económica está por debajo de su potencial por población y en donde el nivel económico no es bajo .
El tercero de los grupos tiene un valor positivo para las tres funciones si bien para la tercera este valor es mayor . Así las cosas podríamos hablar de municipios en los que el nivel económico es alto y el consumo de energía doméstica también lo es .Por otro lado la población se decanta por la actividad en servicios y la actividad económica está por debajo de lo potencialmente posible ( valor positivo y alto del primer factor).
El cuarto de los grupos , recordemos que solo lo forma la ciudad de Valencia , tiene un valor elevadísimo para el primer factor-función , si bien en sentido negativo . Este elevado valor deja sin influencia a los otros dos . Estaríamos hablando de un grupo-municipio en el que la actividad económica de cualquier tipo ( excepto industria) está por encima de su potencial por población.
Pueden comprobarse las coincidencias entre la interpretación que se acaba de realizar y la establecida partiendo de los valores de las variables económicas para los grupos de municipios. Las diferencias son mínimas.
DETERMINACION DE LAS VARIABLES DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO WARD.
Para conseguir las variables más discriminantes de las 33 con las que se está realizando el análisis de la estructura económica del Área Metropolitana de Valencia se parte , como ya se ha dicho , de las puntuaciones de la lambda de Wilks y F de Snedecor . Se observa que todas las variables tienen un valor alto ;superior a uno
Tras la aplicación del algoritmo paso a paso de Wilks ya descrito , y en base a las MANOVAS realizados se llega a la conclusión de la existencia de 27 variables discriminantes de la agrupación en cuatro clusters realizada por el método de Ward. Su número en relación al primario , es decir a las 33 variables iniciales , es muy alto. Intentar interpretar las diferencias entre grupos no supondría algo muy distinto de lo que se interpretó con los valores para cada grupo y para todas las variables , de ahí , que nos remitamos a esa interpretación ,sin proceder a la específica para las 27 variables más discriminantes .
DETERMINACIÓN DE LAS FUNCIONES MÁS DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO WARD.
Una vez encontradas las 27 variables más discriminantes de las utilizadas para el análisis económico , el análisis discriminante se completa con la determinación de unas nuevas variables "inobservables" , que sean capaces de discriminar óptimamente los grupos . Estas nuevas variables son , por construcción , funciones de las variables más discriminantes obtenidas , son combinaciones lineales de ellas , su número , generalmente inferior , es el número de grupos menos una unidad ( en nuestro caso 3) , y tienen la propiedad de ser los ejes de discriminación óptima en el sentido de ser las combinaciones lineales de las "variables discriminantes" que maximizan la varianza entre clusters , al tiempo que hacen mínima la varianza interna de cada cluster o grupo.
Estas variables , llamadas , funciones canónicas , factores o ejes discriminantes , se obtienen por factorización de las variables más discriminantes . Esta factorización nos ofrece la relación funcional lineal entre las variables y los factores , que vendrá dada por la llamada matriz de coeficientes o "patrón discriminante" . partiendo de esta matriz de coeficientes puede evaluarse para cada municipio el valor que toma cada factor discriminantes ( sus puntuaciones discriminantes ) , de forma análoga a como ocurría en el análisis factorial . También de forma análoga al análisis factorial , podrá utilizarse esta matriz de coeficientes , juntamente con las correlaciones entre factores y variables (matriz de estructura) para interpretar los factores discriminantes y poder concluir algunas razones teóricas para las diferencias entre grupos de la agrupación establecida.
De esta manera para la agrupación en cuatro que nos ocupa se calcula su matriz de coeficientes mediante el programa SPSS . En dicha matriz se observan las puntuaciones de las 27 variables más discriminantes obtenidas en relación a las tres funciones discriminantes . Es decir " el peso " positivo o negativo que tienen dichas variables en una determinada función de las tres .
Se realiza y concreta después la matriz de la estructura discriminante en ella se aprecian las correlaciones de las 33 variables económicas originales respecto a los tres factores propuestos. Se encuentran ordenadas en cuanto a "significación" por y para cada una de las tres funciones.
Por último se establecen los valores medios de cada uno de los cuatro clusters respecto a los tres factores discriminantes . En dicha tabla se observa el "peso" que cada factor-función tiene en cada uno de los grupos.
En base a estas tres matrices-tablas es posible intentar interpretar teóricamente las diferencias entre los grupos de la agrupación en cuatro , en base a los tres factores-funciones obtenidas.
Antes de pasar a dicha interpretación puede comprobarse la similitud entre la clasificación (clusterización) obtenida con las funciones discriminantes y la anteriormente obtenida con el análisis cluster que hemos realizado en base a las variables originales y concretamente en este caso por el método de la media. En dicha reclasificación se observa que el nivel de coincidencia se establece en el 98,3 % lo que evidentemente no es nada despreciable . Las diferencias entre los cuatro grupos creados de una u otra manera radica en la ubicación del municipio de Almassera que en la agrupación original estaba en el tercero de los grupos y ahora y con la aplicación de las funciones discriminantes pasa a localizarse en el grupo primero.
INTERPRETACIÓN DE LAS FUNCIONES DISCRIMINANTES DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO WARD PARA EL ANÁLISIS ECONÓMICO.
En base a la matriz de estructura , y a la matriz de valores medios es posible aventurar alguna interpretación de la estructura discriminante de los factores . Si bien algunas funciones tienen pocas variables con las que su correlación sea significativa , lo que dificulta interpretar las sus características y por tanto las características del grupo.
En base a la matriz de estructura , se puede establecer que :
El primer factor-función tiene correlaciones positivas con los indicadores de actividad por superfice, supone concentración espacial de actividad económica.
La segunda función establece correlaciones positivas con el nivel económico , con el consumo de energía doméstica , y con los índices o indicadores económicos
El tercer factor-función mantiene correlaciones positivas y significativas con las diversas tasas de actividad
Observado la matriz de valores medios y relacionando éstos con la características aventuradas para cada factor podemos interpretar las características de cada grupo.
El primero de los grupos del cluster en cuatro tiene valores negativos para la primera y segunda función en términos cuantitativos parecidos, por otro lado tiene correlación positiva , también en parecido valor , con el tercero. Podríamos hablar , por tanto ,de un grupo de municipios con bajo nivel económico , baja actividad económica es su espacio pero alta tasa de actividad entre su población .Serían municipios cuya población con bajo nivel económico trabaja en otros.
El segundo de los grupos con correlación claramente positiva con el segundo de los factores-funciones y algo negativa con los otros dos , podría definirse como un grupo en el que el nivel económico es alto , el consumo de energía doméstica también y la actividad económica se ajusta a sus potenciales .
El tercero de los grupos tiene una correlación negativa con los tres grupos principalmente con el tercero lo que podría indicarnos que los municipios de este grupo poseen escasa tasa de actividad y actividad económica
El cuarto de los grupos tiene valor positivo para el primero de los factores y casi 0 para el resto . Son municipios en los que existe congestión de actividad económica lo que no se traduce en un alto nivel económico.
Pueden comprobarse las coincidencias entre la interpretación que se acaba de realizar y la establecida partiendo de los valores de las variables económicas para los grupos de municipios. Las diferencias son mínimas , como ocurre en la interpretación para las funciones discriminantes en el caso de la utilización del método de la media U.P.G.M.A.,