ANÁLISIS DE LA ESTRUCTURA SOCIAL Y DEMOGRÁFICA DEL A.M.V.

 

            Para llevar acabo el análisis de la estructura social y demográfica del  Área Metropolitana de Valencia se ha considerado la variación de los 37  indicadores-índices socio-demográficos más relevantes . En muchas ocasiones son derivados de la variables originales y presentan la ventaja de ser indicadores relativos pues no dependen del tamaño del municipio.

            La fuentes estadística utilizada para la consecución de estas informaciones ha sido principalmente el Institut Valencia d´Estadistica y hacen referencia temporal al año 2001.Cabe destacar que el número de municipios-individuos tratados no ha sido los 63 que componen el área sino 59 ; se han excluido los tres con menos de 1000 habitantes y San Antonio de Benagéber al que se ha considerado como no desagregado de los cuatro municipios de los que por segregación se constituyó.

            La selección de los indicadores obedece al criterio de compendiar aspectos relevantes de la estructura social como son aquellos que hacen referencia a edad , sexo , formación académica o aquellos que hacen relación a vivienda , congestión urbana , teléfonos o motos.(nota)

            Para analizar la estructura socio-demográfica del A.M.V. se determinan primero los factores subyacentes que explican la variabilidad de estos aspectos en el conjunto de los 59 municipios del Área . Posteriormente agruparemos los municipios en grupos (clusters) lo más homogéneos posibles y finalmente intentaremos analizar las razones de esta agrupación y los factores , indicadores y variables que mejor discriminan los grupos obtenidos y que por tanto , cabe considerar como los principales responsables de la agrupación obtenida. Es lo que se denomina : fases.

            Antes de adentrarnos en la primera fase del análisis (determinación de los factores explicativos de la variabilidad de la estructura socio-demográfica) , o bien como parte previa a ella , resulta conveniente estudiar las relaciones entre los indicadores-índices que vamos a utilizar. Para ello realizamos y estudiamos las correlaciones que existen entre ellos.
               El
exámen de la matriz de correlaciones por diversos métodos nos lleva a considerar adecuados los indicadores utilizados , pues si bien existe alta correlación entre algunos indicadores , lo que por otra parte es lógico , en términos generales la matriz es más que aceptable . Estos análisis se llevan a cabo mediante el programa spss
             

DETERMINACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ESTRUCTURA SOCIO-DEMOGRÁFICA

 

            La determinación de los factores explicativos de la estructura socio-demográfica  se lleva a cabo por el método de las componentes principales  , procediendo tras la obtención de la solución factorial inicial a una rotación ortogonal (varimax Kaiser-normalizada)

            En la tabla de valores propios se recogen los valores para las 34 componentes principales , el porcentaje de la varianza total  que explica cada una de ellas y el porcentaje acumulado de varianza total que van explicando las sucesivas primeras componentes consideradas.

            Observando la tabla  se comprueba que las siete primeras componentes principales explican el 80, 1% de la variabilidad de los 37 indicadores iniciales . Lo que a nuestro entender es suficiente.  Estos análisis se llevan a cabo mediante el programa spss.

            La matriz factorial elaborada nos revela la relación existente entre los siete factores seleccionados y los indicadores originales . Por haberse obtenido por el método de componentes principales nos refleja tanto la relación funcional entre los factores y las variables originales como la correlación . Ello nos permite poder interpretar el significado de los factores obtenidos.

 

INTERPRETACIÓN DE LA SOLUCIÓN INICIAL

Observado la matriz factorial elaborada, se pueden llegar a las siguientes interpretaciones.

Primera componente principal . Este factor presenta alta correlación positiva con la variación de la población. Alta correlación negativa con la edad media , con la tasa de mortalidad , con los índices de vejez y envejecimiento. Alta correlación positiva con segunda vivienda y negativa con primera y desocupada . Alta correlación positiva con niveles de estudios medios y superiores . Y también correlación negativa con concentración de la población. Podríamos decir que es un factor que nos indica : juventud , preparación, expansión demográfica , escaso hacinamiento . En cierto modo podríamos hablar de factor "dinamismo-juventud".

Segunda componente principal .  Este factor presenta alta correlación positiva con la concentración de la población y todas sus , en cierto modo , relacionadas . Presenta correlación negativa alta con variación de la población , infancia y juventud y segunda vivienda , mientras presenta alta correlación positiva con primera vivienda .Podríamos decir que es un factor que nos indica , congestión-hacinamiento y estancamiento. Podríamos hablar de factor de "congestión-estancamiento".

Tercera componente principal .     Este factor indica una alta correlación con crecimiento vegetativo ( no en porcentaje) .Presenta alta correlación  negativa con estudios medios y superiores , siendo positiva la de sin estudios y analfabetos. Presenta , también , alta correlación positiva con la masculinidad .Podríamos hablar de un factor de "falta de preparación - masculinidad".

Cuarta componente principal .        Este factor tiene una alta correlación positiva con la proporción de paro , así como con la tasa de fecundidad . Existe , para este factor , una correlación negativa en cuanto a índice de masculinidad y estudios medios .Podríamos hablar de un factor de "paro-feminidad".

Quinta componente  principal.    Este factor presenta alta correlación en todos los indicadores relacionados con la mayor edad. Presenta , también , alta correlación negativa con la congestión y el hacinamiento .Por sus características : mucha edad , poca congestión urbana , poco paro ,pocas motos ; podríamos estar hablando de un factor de "madurez social"

Sexta componente principal .   Este factor presenta como característica principal la correlación negativa con el índice de reemplazo de la población  y positiva con la población de estudios medios .Parece presuponer un factor de "estancamiento medio"

Séptima componente principal . Este factor presenta alta correlación positiva con el número de teléfonos por habitante y el porcentaje de vivienda desocupada  .Por ello podríamos estar hablando de un factor de "abandono".

A pesar de que la matriz factorial se la solución inicial nos ha permitido aventurar una interpretación teóricamente adecuada para las componentes principales en tanto que factores explicativos de la estructura socio-demográfica , siempre resulta conveniente realizar una rotación de la solución inicial que permita una mejor interpretabilidad de los factores . en este sentido , se ha realizado una rotación ortogonal para conservar la independencia de los factores de esta segunda solución alternativa . El método ha sido el habitual y más conveniente para los fines , una rotación varimax Kaiser-normalizada .

 

INTERPRETACIÓN DE LA SOLUCIÓN ROTADA

 Tras la obtención de la matriz rotada por el método varimax Kaiser-normalizada se pretende interpretar los factores

Observando la matriz rotada elaborada se puede llegar a las siguientes interpretaciones

Primera componente principal . Este factor tiene una lata correlación positiva con la variación de la población y todos los indicadores que podríamos considerar de "juventud" . Tiene , además , una alta correlación negativa con el índice de vejez . Sin embargo existe poca correlación positiva con natalidad y fecundidad . por lo que podemos presuponer que estamos ante un factor que podríamos denominar de juventud-adulta

Segunda componente principal . Este factor está altamente correlacionado de forma positiva con los porcentajes de estudios medios y altos como rasgo fundamental .Podríamos aventurarnos a denominar a este factor como factor "preparación"

Tercera componente principal . Este factor esta alta y positivamente correlacionado con la concentración de la población . No parece que influya la edad . La emigración lo es con correlación negativa . Y también existe correlación positiva con el porcentaje de analfabetos . Por ello se plantea denominar al factor : factor de estancamiento-concentración

Cuarta componente principal .  Este factor está positivamente relacionado con la tasa de natalidad , de fecundidad , infantil , migración e índice de estructura de la población . En sentido contrario , negativamente , se halla correlacionado con la edad y lógicamente con el envejecimiento . No parece influir el tipo de vivienda . Por lo expuesto se cree conveniente denominarle factor de crecimiento demográfico

Quita componente principal .  El factor que supone la quinta componente principal está positivamente correlacionado con el paro y la concentración y congestión urbana . Negativamente lo está con él índice infantil y de vejez . También , negativamente  , se correlaciona con la segunda vivienda. Por ello parece que se debiera de denominar a este factor como : factor de congestión y paro

Sexta componente principal . El factor se correlaciona positivamente con el porcentaje de vivienda desocupada , siendo negativa la correlación con segunda vivienda . Podría aventurarse como factor de decrecimiento demográfico

Séptima componente principal  . Este factor se haya correlacionado positivamente con los menores niveles de estudios y negativamente con los superiores . Por otro lado ,  el factor se correlaciona positivamente con paro y teléfonos por habitante. Podría denominarse a éste factor como , factor de falta de preparación.

        Tras llevar a cabo la interpretación de los factores tanto con la solución inicial como la rotada parece más adecuada ésta ultima . Siendo la interpretación basada en la solución rotada  más coherente y ajustada. Además de ser las puntuaciones obtenidas por la  solución rotada  las que se utilizarán en el análisis cluster

 

PUNTUACIONES OBTENIDAS POR LOS MUNICIPIOS DEL ÁREA SEGÚN LOS FACTORES EXPLICATIVOS DE LA ESTRUCTURA SOCIO-DEMOGRÁFICA

 

            Las puntuaciones que toman los siete factores obtenidos  por la solución rotada se plasman en una tabla , que se ofrece . Si bien en dicha tabla solo se plasman las puntuaciones para los siete factores , la totalidad de las puntuaciones , es decir , para las 34 componentes principales son las que se han utilizado para la elaboración de los análisis cluter .La razón de utilizar las componentes principales radica en la imposibilidad de utilizar la distancia de Mahalanobis con el paquete informático spss , de manera  , que  como la distancia euclidea calculada sobre el espacio de las componentes principales coincide con la distancia de Mahalanobis , utilizando la euclídea ( si presente en spss) sobre las puntuaciones es como si se utilizara la de Mahalanobis sobre las variables originales.

 

 

AGRUPACIÓN DE LOS MUNICIPIOS EN CONGLOMERADOS HOMOGÉNEOS

       

        En esta parte se trata de conseguir grupos de municipios de Área Metropolitana de Valencia en cuanto a similaridades de tipo socio-demográfico , por tanto basadas  , en principio ,  en las variables  o indicadores socio-demográficos que ya se utilizaron en el análisis factorial , no obstante para llevar a cabo esta agrupación de municipios se  ha optado por utilizar las puntuaciones de los municipios para la solución rotada del análisis factorial de la estructura socio-demográfica.

        Estamos , por tanto , en la segunda fase del análisis de la estructura socio-demográfica . Del planteamiento general de esta segunda fase surgen las dos "clusterizaciones" llevadas a cabo cada una por un método : Método de la media (U.P.G.M.A).Método de Ward. Utilizando en ambos casos el criterio de similaridad o distancia de Mahalanobis , lo que en realidad supone la utilización del criterio de la distancia euclídea pero aplicada a las puntuaciones de  los factores , como ya se ha dicho.

 

CLUSTERIZACIÓN POR EL MÉTODO DE WARD

        Se han llevado a cabo los análisis cluster por el método de Ward  centrándonos en concretar agrupaciones de entre dos y cinco grupos . La razón para acotar o reducir a cinco el numero máximo de grupos radica en que de 59 individuos-municipios establecer más de cinco haría difícil concretar las diferencias específicas entre cada uno de ellos. Por otro lado se  ha comprobado tras diversas pruebas que la agrupación en cuatro grupos es la que mejor responde a un análisis multivariado de la varianza siendo por ello la elegida a la hora de los posteriores análisis discriminantes. Los diversos análisis se han realizado con el programa spss .

        Se exponen los diversos resultados  ,tanto a nivel de listado de municipios componentes de las diversas agrupaciones , como a nivel de mapa de éstas .

 

CLUSTERIZACIÓN POR EL MÉTODO DE LA MEDIA ( U.P.G.M.A.).

           Como en el caso del método de Ward  se han concretado las agrupaciones en los mismos términos , es decir plasmando agrupaciones de dos  a cinco grupos o clusters , comprobándose  , por el mismo método MANOVA  ,que la más apropiada es la que supone la subdivisión del A.M. de Valencia en cuatro grupos de municipios, siempre , claro está centrándonos en las informaciones socio-demográficas.

         Se exponen los diversos resultados  ,tanto a nivel de listado de municipios componentes de las diversas agrupaciones , como a nivel de mapa de éstas .

 

ANÁLISIS DE LAS AGRUPACIONES OBTENIDAS.

         Comparando la agrupación en cinco grupos por los dos métodos (mapa upgma5 / mapa ward5) , llama la atención que exista un grupo en ambas compuesto por lo municipios de Godella , Rocafort y l´Eliana  lo que nos indica que algo característico debe ocurrir en ese trío de municipios. Por otro lado en la agrupación en cinco por el método de Ward el municipio de Náquera  forma un grupo "unimunicipal" , resulta curioso si se piensa que el método de Ward es menos sensible a la hora de considerar una gran diferenciación a la hora de considerar una sola de las variables , lo que nos hace pensar que más de una característica hacen que Náquera se comporte como grupo diferente.

        Observado los planos para las agrupaciones en cinco grupos por ambos métodos (mapa upgma5 / mapa ward5) no parece observarse ningún signo de carácter espacial , es decir no hay grupos que tengan unas determinadas características espaciales (sureños , del oeste , concéntricos , etcétera.) . Quizá pueda observarse que los municipios conurbados a la ciudad de Valencia forman grupo con ésta en ambas agrupaciones .(ver plano de conurbaciones)

        En las agrupaciones compuestas por cuatro grupos y para ambos métodos ( mapa upgma4 / mapa ward4 ) , llama la atención que desaparece como grupo "unimunicipal"  Náquera en la agrupación Ward y desaparecen como grupo los municipios de Godella , Rocafort y l´Eliana en la agrupación U.P.G.M.A. , manteniéndose este grupo de tres  en la Ward.

        Para cuatro grupos  ,  y mediante el método de la media  , estos están formados por un número casi idéntico de elementos  , mientras que para el método de Ward existen tres grupos de parecido número de miembros y otro , el de los tres citados municipios.

        Como en los casos de agrupaciones en cinco grupos no se observa , para  la agrupación en cuatro , ninguna pauta geográfico-espacial característica salvo quizá la antes citada de la conurbación

        Las agrupaciones en tres grupos ( mapa upgma3 / mapa ward3 )  no plantean ninguna característica especial que nos haga plantearnos a priori ciertas propiedades de los grupos . En la agrupación en tres por el método de Ward sigue manteniéndose el grupo de los tres municipios que existe desde el principio .Por otro lado siguen sin manifestarse pautas o comportamientos espaciales en los diversos grupos de las dos agrupaciones.

        Las agrupaciones en dos grupos ( mapa upgma2 / mapa ward2 ) siguen sin plantear pautas de comportamiento espacial que nos sugiera alguna característica . El grupo de tres municipios que se había mantenido en las agrupaciones anteriores mediante el método de Ward , desaparece . Puede observarse  que en ambas agrupaciones existe un grupo de municipios que forman grupo con la ciudad de Valencia y que precisamente son , casi siempre , los más próximos .

        Por lo expuesto parece importante considerar a los municipios de Godella , l´Eliana y Rocafort , como grupo pues aparece en agrupaciones establecidas por ambos métodos y en el caso de las de Ward reiteradamente . En la agrupación por Ward  de cuatro grupos ya se ha incluido en uno de ellos al municipio de Náquera que formaba grupo solitariamente en la de cinco . Por estas dos razones y  dado que las agrupaciones en cuatro son las que mejor responden a un análisis multivariante de la varianza , se desarrollara  para éstas  un análisis que nos permita discriminar los grupos de manera más clara y detallada.Es decir se someterá a las agrupaciones de cuatro grupos por los métodos de Ward y U.P.G.M.A. a un análisis discriminante .

        De momento , se han calculado los valores de las variable-indicadores utilizados en este análisis socio-demográfico para los diversos ( cuatro) grupos de municipios de las dos agrupaciones (Ward-UPGMA). En base a esta información se pueden aventurar algunas características de los grupos formados.

 

INTERPRETACIÓN DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO DE WARD.
EN BASE A LOS VALORES DE LA VARIABLES.
ESTRUCTURA SOCIO-DEMOGRÁFICA

De la información de las variables-indicadores agregadas y cálculadas para los cuatro grupos creados por el método de Ward ,   por comparación entre ellas ,  podemos vislumbrar algunas características que los distingan . Ver también municipios que componen esta agrupación y su correspondiente plano

        El grupo cuarto    de municipios  como unidad  tiene una proporción de paro muy inferior al de los otros tres grupos. El porcentaje de variación de población el la última década es muy superior al de los demás .La edad media de hombres y mujeres se sitúa tres años por debajo de algún otro grupo . La tasa de mortalidad es con diferencia la más baja de los cuatro grupos . La proporción de segunda vivienda es muy alta . Por último el porcentaje de población con estudios superiores y medios es el más , con diferencia , de los cuatro grupos. Resumiendo ; en estos municipios  , tomados como un todo , vive gente joven con nivel de estudios altos, existe poco paro  y  ha aumentado mucho la población . Recordemos que este grupo lo forman l´Eliana (recordemos que incluye parte de San Antonio de Benagéber)  , Rocafort y Godella.

        El grupo tercero de municipios como unidad tiene una baja población por kilómetro cuadrado , un altísimo porcentaje de personas con estudios básicos y mínimo porcentaje para estudios superiores . La tasa de mortalidad es la más alta de los cuatro grupos y, como es lógico el índice de vejez y envejecimiento son los más altos.El porcentaje de segunda vivienda también es alto . Parecen , por tanto, municipios con poca densidad de población y ésta de edad avanzada.

        El segundo grupo de municipios como unidad tiene una alta tasa de natalidad y fecundidad .Una tasa de migración también alta , la mayor. El mayor índice de masculinidad . Los mayores porcentajes de analfabetismo y de población sin estudios . Y también el mayor porcentaje de índice de juventud . Parecen municipios que tomados como conjunto son receptores de población de escasa preparación .

        El grupo primero de municipios como unidad tiene la menor tasa de migración de los cuatro grupos , la mayor tasa de paro , el menor índice de masculinidad y la mayor densidad de población . Parecen municipios que formando un todo  podríamos hablar de ellos como congestionados.

 

INTERPRETACIÓN DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A.
EN BASE A LOS VALORES DE LA VARIABLES.
ESTRUCTURA SOCIO-DEMOGRÁFICA

De la información de las variables-indicadores agregadas y cálculadas para los cuatro grupos creados por el método de media U.P.G.M.A. ,   por comparación entre ellas ,  podemos vislumbrar algunas características que los distingan . Ver también municipios que componen esta agrupación y su correspondiente plano

El grupo cuarto tiene , si se toma como conjunto , la menor tasa de paro de los cuatro . El índice de concentración de la población ( recordemos que mide el porcentaje de población dispersa) más alto de los cuatro . La densidad de población por kilómetro cuadrado es la más baja de los cuatro grupos. La proporción de segunda vivienda es exageradamente superior a la de los otros grupos creados con éste método. Por lo expuesto son , en conjunto , municipios claramente de segunda residencia , y de edificación no concentrada.

El grupo tercero tiene en conjunto una tasa de migración positiva y alta . El  porcentaje de vivienda desocupada más elevado de los cuatro .Estaríamos probablemente  , por consecuencia de otros valores no tan altos pero si reveladores , ante municipios que en conjunto son o están envejecidos pero empiezan a ser receptores de población.

El grupo segundo tiene las edades medias más bajas de los cuatro; la tasa de natalidad más alta. El crecimiento vegetativo más alto. El mayor porcentaje de la población tiene estudios básicos . Los indicadores de vejez son los menores del área. Estaríamos  , por tanto ,  ante municipios que en conjunto son receptores de población joven y de escasa preparación.

El primer grupo de municipios tiene multitud de indicadores extremos , tanto por exceso como por defecto . Es el grupo con mayor paro , con mayor edad media , con mayor concentración de la población, con menor porcentaje de segunda vivienda , con mayor porcentaje de población con estudios superiores o medios , con mayor densidad de población. Parecen , en definitiva , y como conjunto municipios claramente "urbanos" entendiendo como urbanos una amalgama de situaciones diversas claramente compensadas y hacinadas..

 

DETERMINACIÓN DE LAS VARIABLES MÁS DISCRIMINANTES

 

 Una vez obtenidas las agrupaciones  y elegidas la s agrupaciones de cuatro grupos  por  los métodos de Ward y de la media , se intenta establecer las variables más discriminantes que han establecido dichas clasificaciones . Para ello se realiza un análisis discriminante.

El método de obtención de las variables más discriminantes que se ha utilizado en éste y otros análisis discriminantes es el algoritmo paso a paso de Wilks , que basándose en sucesivos y simultáneos análisis multivariantes de la varianza nos va generando en cada paso los sucesivos conjuntos de variables que mejor discriminen. En cada paso se planteando la posibilidad de introducir una nueva variable más , o bien de excluir una de las ya consideradas.La primera variable a considerar en el análisis será , obviamente aquella que mejor discrimine la agrupación , lo que se mide a partir del estadístico lambda  de Wilks , o su equivalente F de Snedecor ; y en cada paso la variable sobre la que se considera la posibilidad de su eventual inclusión es también la de mayor poder discriminante de las que resten por introducir . La posibilidad última de entrada de una variable no considerada hasta el momento , y la posibilidad de salida de una de las variables ya consideradas se supedita al valor que tome el estadístico F de cambio (F de entrada y F de salida).Los estadísticos F de entrada y de F de salida nos miden la mejora del poder discriminante al introducir una nueva variable o al excluir una ya considerada. para que una variable pueda ser considerada se le exige que su F de entrada sea elevada y para que se mantenga se le exige , en cada paso , que su F de salida sea también elevada 
El criterio que se ha utilizado en los cuatro análisis ha sido el exigir a las F de cambio que superar el valor 1 . Además de considerar la posibilidad de introducir o de eliminar , en cada paso una de las variables , el algoritmo controla que en todo momento las variables seleccionadas no produzcan una discriminación redundante ( exigiendo que la correlación multiple no sea excesiva ) . Siguiendo con estas directrices , el proceso se lleva a cabo  paso a paso , replanteándose en cada momento la situación hasta que la mejora de la discriminación no sea posible , ni introduciendo una variable ni eliminando alguna ya introducida.

 

DETERMINACION DE LAS VARIABLES DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO  U.P.G.M.A.

    Para conseguir las variables más discriminantes de las 34 con las que se está realizando el análisis de la estructura socio-demográfica del A.M.de .V se parte , como ya se ha dicho de las puntuaciones de la lambda de Wilks y F de Snedecor . Se observa que todas las variables tienen un valor alto (superior a 1 ) excepto una ( porcentaje de estudios medios).

    Tras la aplicación del algoritmo paso a paso de Wilks  ya descrito  ,  y en base a las MANOVAS realizados se llega a la conclusión de la existencia de 25 variables discriminantes de la agrupación en cuatro clusters realizada por el método de la media (U.P.G.M.A.) . Su número en relación al primario , es decir a las 34 variables iniciales  , es muy alto. Intentar interpretar las diferencias entre grupos no supondría algo muy distinto de lo que se interpretó con los valores para cada grupo y para todas las variables , de ahí  , que nos remitamos a esa interpretación ,sin proceder a la específica para las 25 variables más discriminantes , máxime si algunas de las eliminadas están muy relacionadas con las no descartadas.

 

DETERMINACIÓN DE LAS FUNCIONES MÁS DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A.

Una vez seleccionadas las 25 variables más discriminantes de las utilizadas para el análisis socio-demográfico , el análisis discriminante se completa con la determinación de unas nuevas variables "inobservables" , que sean capaces de discriminar óptimamente los grupos . Estas nuevas variables son , por construcción , funciones de las variables más discriminantes obtenidas  , son combinaciones lineales de ellas , su número , generalmente inferior , es el número de grupos menos una unidad  ( en nuestro caso 3) , y tienen la propiedad de ser los ejes de discriminación óptima en el sentido de ser las combinaciones lineales de las "variables discriminantes" que maximizan la varianza entre clusters , al tiempo que hacen mínima la varianza interna de cada cluster o grupo.

Estas variables , llamadas , funciones canónicas , factores o ejes discriminantes , se obtienen por factorización de las variables más discriminantes . Esta factorización nos ofrece la relación funcional lineal entre las variables y los factores , que vendrá dada por la llamada matriz de coeficientes o "patrón discriminante" . partiendo de esta matriz de coeficientes puede evaluarse para cada municipio el valor que toma cada factor discriminantes ( sus puntuaciones discriminantes ) , de forma análoga a como ocurría en el análisis factorial . También de forma análoga al análisis factorial , podrá utilizarse esta matriz de coeficientes , juntamente con las correlaciones entre factores y variables  (matriz de estructura) para interpretar los factores discriminantes y poder concluir algunas razones teóricas para las diferencias entre grupos de la agrupación establecida.

De esta manera para la agrupación en cuatro que nos ocupa se calcula su matriz de coeficientes mediante el programa SPSS . En dicha matriz se observan las puntuaciones de las 25 variables más discriminantes obtenidas en relación a las tres funciones discriminantes . Es decir " el peso " positivo o negativo que tienen dichas variables en una determinada función de las tres .

Se realiza  y concreta despúes  la matriz de la estructura discriminante en ella se aprecian las correlaciones de las 34 variables originales respecto a los tres factores propuestos. Se encuentran ordenadas en cuanto a "significación" por y para cada una de las  tres funciones.

Por último se establecen los valores medios de cada uno de los cuatro clusters respecto a los tres factores discriminantes . En dicha tabla  se observa el "peso" que cada factor-función  tiene en cada uno de los grupos.

En base a estas tres matrices-tablas es posible intentar interpretar teóricamente las diferencias entre los grupos de la agrupación en cuatro , en base a los tres factores-funciones  obtenidas.

Antes de pasar a dicha interpretación puede comprobarse la similitud entre  la clasificación (clusterización) obtenida con las funciones discriminantes y la anteriormente obtenida con el análisis cluster que hemos realizado en base a las variables originales y concretamente en este caso por el método de la media. En dicha reclasificación se observa que el nivel de coincidencia se establece en el 98,3 % lo que evidentemente no es nada despreciable . Las diferencias entre los  cuatro grupos creados de una u otra manera radica en la ubicación del municipios de Foios que en la agrupación original estaba en el primero de los grupos y ahora y con la aplicación de las funciones discriminantes pasa a localizarse en el grupo tercero.

INTERPRETACIÓN DE LAS FUNCIONES DISCRIMINANTES DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO U.P.G.M.A PARA EL ANÁLISIS SOCIO-DEMOGRÁFICO.

 En base a la matriz de estructura ,  y la matriz de valores medios  es posible aventurar alguna interpretación de la estructura discriminante de los factores .

En base a la matriz de estructura , se puede establecer que :

El primer factor supone la presencia de segunda vivienda , de población mayor , de variación de la población positiva , de menor paro.

El segundo factor supone la presencia de nivel de estudios bajos , tasa de natalidad alta , vivienda desocupada  , menor densidad de población .

El tercer factor supone  nivel de estudios alto , población más masculina , población más joven.

Observado la matriz de valores medios y relacionando éstos con la características aventuradas para cada factor  podemos interpretar las características de cada grupo.

El primero de los grupos del cluster en cuatro tiene valores claramente negativos del primero y segundo factor y algo positivo el tercero . Podría plantearse que los municipios de grupos primero son aquellos con escasa segunda vivienda ( el factor uno planteaba segunda vivienda y dado su peso negativo cabrá suponer que en el grupo primero no la hay), paro elevado , escaso nivel de estudios bajos , tasa de natalidad baja, la población no es joven .

El segundo de los grupos con una influencia mayor positiva del segundo factor , algo negativa del primero y algo positiva del segundo . Se postula como un grupo en el que el nivel de estudios es bajo , la natalidad alta , la población es joven , existiendo poca vivienda desocupada .

El tercero de los grupos con influencia claramente negativa de la tercera función y escasamente positiva y negativa en la primera y segunda . Se plantea como un grupo de municipios donde lo característico es la falta de estudios superiores o medios y  falta , también , de población joven y masculina .

El cuarto de los grupos tiene valores positivos para el primer y tercer factor y algo negativo para el segundo . La influencia positiva del primero es muy superior a la del tercero . Por ello estaríamos ante municipios con segunda vivienda con poco paro con población mayor y altamente concentrada.

Pueden comprobarse las coincidencias entre la interpretación que se acaba de realizar y la que establecida partiendo de los valores de las variables socio-demográficas  para los grupos de municipios. Las diferencias son mínimas.

 

DETERMINACION DE LAS VARIABLES DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO  WARD.

    Dada la similitud (hasta en ciertos resultados) entre las determinación de las variables discriminantes en la agrupación de cuatro grupos por el método de la media U.P.G.M.A . y esta que se comienza  , es posible que al lector le de la sensación de leer lo mismo; textualmente es posible ; hipertextualmente , no.

    Para conseguir las variables más discriminantes de las 34 con las que se está realizando el análisis de la estructura socio-demográfica del Área Metropolitana de Valencia se parte , como ya se ha dicho ,  de las puntuaciones de la lambda de Wilks y F de Snedecor . Se observa que todas las variables tienen un valor alto (superior a 1 ) excepto cinco ( las tres de tipo de vivienda ,teléfonos por habitante e índice de concentración de la población)

    Tras la aplicación del algoritmo paso a paso de Wilks  ya descrito  ,  y en base a las MANOVAS realizados se llega a la conclusión como en el caso de la agrupación u.p.g.m.a.de la existencia de 25 variables discriminantes de la agrupación en cuatro clusters realizada por el método de  Ward. Su número en relación al primario , es decir a las 34 variables iniciales  , es muy alto. Intentar interpretar las diferencias entre grupos no supondría algo muy distinto de lo que se interpretó con los valores para cada grupo y para todas las variables , de ahí  , que nos remitamos a esa interpretación ,sin proceder a la específica para las 25 variables más discriminantes .

 

DETERMINACIÓN DE LAS FUNCIONES MÁS DISCRIMINANTES EN LA AGRUPACIÓN DE CUATRO GRUPOS POR EL MÉTODO WARD.

Una vez encontradas  las 25 variables más discriminantes de las utilizadas para el análisis socio-demográfico , el análisis discriminante se completa con la determinación de unas nuevas variables "inobservables" , que sean capaces de discriminar óptimamente los grupos . Estas nuevas variables son , por construcción , funciones de las variables más discriminantes obtenidas  , son combinaciones lineales de ellas , su número , generalmente inferior , es el número de grupos menos una unidad  ( en nuestro caso 3) , y tienen la propiedad de ser los ejes de discriminación óptima en el sentido de ser las combinaciones lineales de las "variables discriminantes" que maximizan la varianza entre clusters , al tiempo que hacen mínima la varianza interna de cada cluster o grupo.

Estas variables , llamadas , funciones canónicas , factores o ejes discriminantes , se obtienen por factorización de las variables más discriminantes . Esta factorización nos ofrece la relación funcional lineal entre las variables y los factores , que vendrá dada por la llamada matriz de coeficientes o "patrón discriminante" . partiendo de esta matriz de coeficientes puede evaluarse para cada municipio el valor que toma cada factor discriminantes ( sus puntuaciones discriminantes ) , de forma análoga a como ocurría en el análisis factorial . También de forma análoga al análisis factorial , podrá utilizarse esta matriz de coeficientes , juntamente con las correlaciones entre factores y variables  (matriz de estructura) para interpretar los factores discriminantes y poder concluir algunas razones teóricas para las diferencias entre grupos de la agrupación establecida.

De esta manera para la agrupación en cuatro que nos ocupa se calcula su matriz de coeficientes mediante el programa SPSS . En dicha matriz se observan las puntuaciones de las 25 variables más discriminantes obtenidas en relación a las tres funciones discriminantes . Es decir " el peso " positivo o negativo que tienen dichas variables en una determinada función de las tres .

Se realiza  y concreta después  la matriz de la estructura discriminante en ella se aprecian las correlaciones de las 34 variables originales respecto a los tres factores propuestos. Se encuentran ordenadas en cuanto a "significación" por y para cada una de las  tres funciones.

Por último se establecen los valores medios de cada uno de los cuatro clusters respecto a los tres factores discriminantes . En dicha tabla  se observa el "peso" que cada factor-función  tiene en cada uno de los grupos.

En base a estas tres matrices-tablas es posible intentar interpretar teóricamente las diferencias entre los grupos de la agrupación en cuatro , en base a los tres factores-funciones  obtenidas.

Antes de pasar a dicha interpretación puede comprobarse la similitud entre  la clasificación (clusterización) obtenida con las funciones discriminantes y la anteriormente obtenida con el análisis cluster que hemos realizado en base a las variables originales y concretamente en este caso por el método de la media. En dicha reclasificación se observa que el nivel de coincidencia se establece en el 98,3 % lo que evidentemente no es nada despreciable . Las diferencias entre los  cuatro grupos creados de una u otra manera radica en la ubicación del municipios de Foios que en la agrupación original estaba en el primero de los grupos y ahora y con la aplicación de las funciones discriminantes pasa a localizarse en el grupo tercero.

 

INTERPRETACIÓN DE LAS FUNCIONES DISCRIMINANTES DE LA AGRUPACIÓN EN CUATRO GRUPOS POR EL MÉTODO WARD  PARA EL ANÁLISIS SOCIO-DEMOGRÁFICO.

 En base a la matriz de estructura ,  y  a la matriz de valores medios  es posible aventurar alguna interpretación de la estructura discriminante de los factores . Si bien algunas funciones  tienen pocas variables con las que su  correlación sea significativa , lo que dificulta interpretar las sus características y por tanto las características del grupo.

En base a la matriz de estructura , se puede establecer que :

El primer factor-función tiene escasas correlaciones con las variables que lo sean significativas ,entre ellas :  correlación positiva con el nivel de estudios superiores y con la variación positiva de la población

La segunda función  parece contemplar una tasa de fecundidad baja una alta congestión relativa respecto al máximo del área , y una migración también negativa.

El tercer factor , con más correlaciones con variables significativas contempla : edad media de las mujeres baja , población envejecida , bajo índice  o porcentaje de paro ,población con estudios medios , población femenina  y crecimiento vegetativo negativo

Observado la matriz de valores medios y relacionando éstos con la características aventuradas para cada factor  podemos interpretar las características de cada grupo.

El primero de los grupos del cluster en cuatro tiene valores negativos para la primera función y la tercera y bastante positiva para la segunda . Partiendo de lo expuesto se podría aventurar que en los municipios que forman este grupo , la tasa de fecundidad y natalidad es baja y existe alta congestión relativa de vivienda , en cuanto a aspectos menos claros podríamos hablar de menor porcentaje de estudios superiores y bajo nivel de variación positiva de la población.

El segundo de los grupos con una influencia negativa de las funciones-factores segundo y tercero ,  casi en el mismo grado  , y un valor positivo pero casi insignificante en la primera . Podría plantearse que este grupo está compuesto por municipios con bajo índice de vejez , alto paro , edad mayor de las mujeres , índice de masculinidad positivo , tasa de migración positiva  y crecimiento vegetativo positivo.

El tercero de los grupos tiene relación  claramente negativa en la primera y segunda función y claramente positiva en la tercera por tanto se puede interpretar que los municipios que lo componen son aquellos con :  edad media de las mujeres baja , índice de masculinidad bajo , altos índices relacionados con la vejez , alto porcentaje de paro , alto porcentaje de estudios medios  y bajos, y crecimiento vegetativo negativo

El cuarto de los grupos tiene valores positivos para  las tres funciones , pero de manera decisiva para la primera función-factor ,son , por tanto municipios con alto porcentaje de población con estudios superiores , y con variación de la población positiva.

Pueden comprobarse    las coincidencias entre la interpretación que se acaba de realizar y la que establecida partiendo de los valores de las variables socio-demográficas  para los grupos de municipios. Las diferencias son mínimas , como ocurre  en la interpretación para las funciones discriminantes en el caso de la utilización del método de la media U.P.G.M.A.,

 

?