1. Introducción

Estas notas ofrecen unas ideas generales sobre como localizar la población en el espacio cuando solo disponemos de la misma para áreas relativamente grandes, lo que la literatura denomina areal data. Las ideas son aplicables más generalmente a otras cuestiones como, por ejemplo, acotar empleos, centros de servicios o amenities, y suelen combinar, al menos, 2 tipos de información:

  1. Por una parte, información estadística sobre la población de la que conocemos su localización aproximada en forma de cartografía digital referente a un área.

  2. Por otra parte, información geográfica sobre edificaciones, y/o usos y/o coberturas del suelo.

Por ejemplo, podemos disponer de la población municipal, pero un municipio puede ser muy grande y claramente la población no se encuentra uniformemente distribuida sobre el término municipal. En muchas ocasiones necesitamos disponer de una localización más precisa, y quizá tengamos información auxiliar sobre edificaciones y sus atributos, o sobre los núcleos de población en formato poligonal o puntual.

Podemos pensar en muchas circunstancias en las que una localización precisa de la población es deseable. La más obvia podría ser cuestiones relacionadas con la accesibilidad de la población a determinados servicios o lugares de ocio, pero también en lo referente a la localización de esos servicios –precisamente para facilitar la accesibilidad–, el establecimiento de paradas del transporte público o para estudiar la distribución de la población sobre el territorio y sus relaciones con el medio ambiente. También para cuestiones referentes a la gestión de riesgos derivados de catástrofes, como por ejemplo la población vulnerable en casos de inundación o nubes tóxicas.

2. ¿Cual es exactamente nuestro problema?

Problema

Disponemos de la población con una cierta resolución, que normalmente hace referencia a un área, y queremos una localización –puntual o poligonal– más precisa que nuestra información de partida.

Para algo de background debes leer el capítulo 1 de Goerlich y Cantarino (2012), el razonamiento allí está hecho en términos poligonales, pero los mismos principios se aplican en términos puntuales, que será el objeto del ejercicio final de estas notas.

Partiendo de información municipal ilustraremos primero las alternativas disponibles sobre la demografía inframunicipal, mencionando sus pros y sus cons, para finalmente realizar un ejercicio con una de estas alternativas.

El procedimiento final se ilustra con un ejemplo concreto que es suficientemente heterogéneo como para resumir la mayor parte de los problemas con los que podemos encontrarnos en la práctica cuando deseamos una resolución por debajo del municipio. Ello permite ver las soluciones adoptadas, así como apuntar posibles mejoras sobre el sencillo ejercicio presentado.

La parte computacional se ilustra en su totalidad a partir de la librería sf (Pebesma 2018) para el manejo de información vectorial en el entorno del sistema de cálculo estadístico R (R Core Team 2022). Los mapas interactivos están hecho con mapview (Appelhans, Detsch, Reudenbach y Woellauer 2022) y las tablas con kableExtra (Zhu 2021).

En cierta forma, estas notas nos devuelven a las primeras diapositivas de la presentación sobre el cálculo de rutas con población en grid, y nos muestran que disponer de un fichero de población con elevada resolución no es, en modo alguno, una cuestión trivial.

El ejercicio con el que se ilustran estas notas está disponible si se solicita al en formato de un project de R bajo licencia GPLv3.

3. El punto de partida

Nuestro ejemplo parte del municipio de Requena (46213), del que conocemos su población, 20 058 habitantes según el Padrón de 2022 del Instituto Nacional de Estadística (INE) y el contorno de su término municipal a partir de la Base de Datos de Líneas Límite del Instituto Geográfico Nacional (IGN).1

Requena (46213) tiene un término municipal muy amplio, 814 km², y, de acuerdo con el Nomenclátor, solo el 78% de su población vive en el núcleo principal, 15 687 personas. El 22% restante, 4 371 personas, viven dispersas por el término municipal, y naturalmente tienen condiciones de vida bastante diferentes de las personas residentes en el núcleo principal en términos, por ejemplo, de su accesibilidad al Hospital situado en el municipio y que se localiza en la parte este del núcleo principal.

El mapa 1, que se ofrece a continuación, muestra el término municipal de Requena, y permite examinar sobre la capa de fondo –Open Street Map– sus núcleos de población. ¡Es interactivo!, así que navega por él para familiarizarte con la geografía. La geografía, al contrario que el PIB, se ve, ¡y no debes desaprovechar esta ventaja, 😄!

Mapa 1 - Término municipal de Requena

Nuestro objetivo es lograr una distribución de la población dentro del municipio de Requena (46213) que sea razonablemente fiable.

Antes de dirigirnos hacia esa tarea pensemos en el significado de la cifra de población de Requena (46213). Los 20 058 habitantes residen dentro del término municipal mostrado en el mapa anterior, pero desde luego esta distribución no es en absoluto uniforme, que es lo que supone el cálculo estándar de densidades de población. La densidad de población de Requena (46213) es de 25 habitantes/km², pero sin duda la mayor parte de la superficie del término municipal está vacía. ¡Tendremos ocasión de comprobarlo!, pero debe ser evidente a partir de la inspección del mapa anterior.

Sin embargo, con la información disponible –cifra de población y término municipal– no sabemos donde está situada realmente la población dentro del municipio. Antes de aumentar la escala geográfica, considera la siguiente pregunta de interés: Si quisiéramos un punto –coordenada– representativa de la población del municipio, ¿cual sería?

La intuición sugiere que aquel donde reside el mayor volumen de población, 👍.

¿Disponemos de este punto? Como veremos a continuación si, pero supongamos de momento que no.

Para empezar, es cierto que podemos ver dicho punto en el mapa anterior. Sitúa el cursor sobre el núcleo principal de Requena y examina las coordenadas de la localización del cursor en la esquina superior izquierda del mapa. ¡Podríamos anotar dichas coordenadas!, aunque veremos a continuación que hay una forma mucho más sencilla de obtener estas coordenadas.

Lo que si es cierto es que, dado un polígono, siempre podemos construir un punto representativo del mismo. Es lo que la literatura de los Sistemas de Información Geográfica (GIS) llama centroide, y se puede obtener a partir de st_centroid. Esa instrucción transforma una capa –layer– poligonal en puntual, donde los puntos representan los centroides de los polígonos.

¿Es razonable este punto –el centroide del término municipal de Requena (46213)– como punto para localizar la población? No, definitivamente no. Este es un punto geométrico, que no tiene relación directa con nuestra variable de interés, la población.

Afortunadamente, el Nomenclátor Geográfico de Municipios y Entidades de Población del IGN, disponible en el Centro de Descargas del Centro Nacional de Información Geográfica (CNIG) dispone de las coordenadas de los municipios que son representativas de donde se localiza la población del municipio, digamos del núcleo principal.2 Estas coordenadas –en realidad las de la capital del municipio– fueron las utilizadas en los cálculos de accesibilidad de Goerlich, Maudos y Mollá (2021).

El mapa 2 ofrece, junto a la delimitación del término municipal,

(i) el centroide del polígono, y

(ii) la coordenada del municipio procedente del Nomenclátor Geográfico de Municipios y Entidades de Población del IGN.

Mapa 2 - Término municipal de Requena: Centroide y Capital del Municipio

Podemos observar como el centroide del polígono se sitúa en medio de la nada, y no constituye un punto representativo de la localización de la población.

Observación 1:

El centroide de un polígono no es, normalmente, un punto representativo de la información en la que estamos interesados.

Así pues, tenemos solucionado el problema de la localización de la población a nivel municipal, tanto a nivel poligonal como puntual, pero el objetivo es aumentar la resolución. Los mapas anteriores permiten observar como el territorio está, en muchos casos, vacío y la distribución de la población dentro del municipio puede ser relevante, tanto en el mundo urbano como en el rural.

4. Estadísticas de población inframunicipal

4.1 Población en grid

Impulsado por Eurostat disponemos, en algunas ocasiones, de población en formato de grid con resolución de 1km \(\times\) 1km. El sistema de grids europeo, para reporte estadístico, está normalizado por INSPIRE, de forma que no debemos preocuparnos de como definir o nombrar las celdas.

La última grid disponible puede descargarse del GISCO de Eurostat para toda Europa, de donde es posible extraer las celdas que corresponden a España, ¡o a Requena!, a partir de sus contornos admistrativos –Goerlich (2023a) facilita enormemente esta tarea, 👍–. Corresponde a 2018, y fue una actualización del Joint Research Centre (JRC) a partir de la grid censal de 2011.3

Las celdas habitadas correspondientes a Requena (46213) son 44, de forma que, a esta resolución, solo existen 44 km² cuadrados habitados, es decir, el 5% del territorio. Estas celdas se ofrecen en el mapa 3 situadas sobre el término municipal, y permiten examinar la distribución de la población dentro del municipio, ¡hemos pasado de 1 punto de población a 44! Observamos a simple vista donde están los núcleos principales y donde la población más dispersa. Podemos ver que el núcleo principal de Requena comprende 7 celdas, y que algunos pequeños núcleos están notablemente alejados del núcleo principal.

Mapa 3 - Término municipal de Requena y celdas (1km \(\times\) 1km) habitadas

La inspección del mapa permite observar, también, que hay celdas interiores –están totalmente dentro del término municipal–, 35 celdas, y celdas borde –intersectan los lindes municipales–, 9 celdas. Con la información disponible solamente en la grid, no es posible saber si la población de estas celdas borde pertenece a Requena (46213), al municipio vecino o a ambos, y en este caso cuanta población pertenece a cada municipio. ¡Examina las celdas borde del mapa anterior y observarás casos para todos los gustos!

Si lo que deseamos es un punto representativo de donde se sitúa la población dentro de la celda, ahora sí, el centroide –el centro de la celda– es el punto natural. Podemos ver esta distribución en el mapa 4. Observa como ahora el punto está dentro o fuera del término municipal, de forma que aunque existen celdas borde no existen centroides borde, 😄.

Mapa 4 - Término municipal de Requena: Celdas habitadas y su centroide

¿Es esta una representación adecuada de la distribución de la población dentro del municipio? , dada su resolución, 1km \(\times\) 1km.

Los cálculos de la presentación sobre el cálculo de rutas con población en grid se hicieron con esta grid para toda España.

Observación 2:

Las grids deben entenderse como un sistema flexible de combinar información con orígenes muy diversos y, por tanto, como una geometría intermedia de cálculo para obtener información sobre las áreas que a nosotros nos interese.

En gran parte, las grids se propusieron para esto, pero naturalmente, tienen sus pros y sus cons.

4.1.1 Población en grid: Pros

  • La grids son invariantes en el tiempo, y no sufren del problema de las alteraciones de unidades poblacionales. ¡Los municipios cambian en el tiempo!, hay fusiones, segregaciones y cambios de límites, ¡las celdas de la grid no!

  • La resolución actual, 1km \(\times\) 1km, proporciona un equilibro adecuado para análisis sobre grandes áreas, por ejemplo, el conjunto de España o toda Europa. Proporcionan una resolución aceptable en el mundo urbano, y aumentan notablemente la resolución en el mundo rural.

  • El tamaño de las unidades de análisis –las celdas– son todas idénticas, lo que elimina ciertos problemas asociados a la heterogeneidad en el tratamiento estadístico de la información con base espacial. ¡Las unidades administrativas son altamente heterogéneas en forma y tamaño!

4.1.2 Población en grid: Cons

  • Esta estadística no está implantada actualmente sobre una base anual, como el Padrón.

  • Actualmente las grids son, en mayor o menor grado, el producto de una estimación estadística. Incluida la grid del censo de 2011 (Goerlich y Cantarino 2014; 2015a y 2017), aunque se espera que esta cuestión se solucione en un plazo breve de tiempo.

  • De momento, y en el mejor de los casos, solo disponemos en este formato de una variable: la población. En el futuro deberemos disponer, también, de algunas características de las mismas.

  • Las grids y las unidades administrativas son sistemas zonales incompatibles –no agregan–. Lo que esto quiere decir, en la práctica, es que el paso de la información en grid a las unidades administrativas de interés requiere adoptar una decisión sobre el tratamiento de las celdas borde.4

La literatura ha adoptado diferentes soluciones a esta última cuestión.

Las instituciones europeas han propugnado la rasterificación de los contornos administrativos (Freire, MacManus, Pesaresi, Doxsey-Whitfield y Mills 2016, Florczyk et al 2019, Maffenini, Schiavina, Freire, Melchiorri, Pesaresi y Kemper 2020), pero esta no creo que sea una solución aceptable para datos municipales y una resolución de 1km \(\times\) 1km de tamaño de celda. Simplemente algunos municipios son demasiado pequeños, con superficie inferior a 1km², y se pierden en el proceso. Existen alternativas, pero no son sencillas de implementar.

A partir de la inspección visual de los mapas de la grid anteriores existen dos soluciones sencillas posibles y una tercera algo más compleja:

  1. Considerar solo las celdas interiores al municipio. Presenta el problema de que los municipios pequeños, con superficie inferior a 1km², no tienen celdas interiores, y, de nuevo, se pierden.

  2. Considerar las celdas que tienen intersección no nula con el municipio –las interiores, más las celdas borde–. Los cálculos de la presentación sobre el cálculo de rutas con población en grid consideraron esta aproximación. En este caso, cualquier cálculo debe partir siempre de las celdas, es decir, los cálculos para las Comunidades Autónoma (CCAA) no deben obtenerse a partir de los municipios, sino de las celdas –las celdas borde entre municipios interiores de una CCAA son interiores respecto a esa CCAA–.

  3. Siempre existe una aproximación intermedia. Podemos distribuir la variable de interés –población– de las celdas borde entre las unidades administrativas con las que tiene intersección no nula. Un método sencillo para ello es areal weighting –que sabemos no funciona bien en la mayoría de los casos–. De esta forma, la geometría intermedia de trabajo es el producto cartesiano de los lindes administrativos y la grid. Naturalmente, para ser rigurosos, ello requiere, normalmente, hacer ajustes en el sistema de reparto, de forma que al agregar por los lindes administrativos se obtenga la variable a este nivel de agregación –municipios– y al agregar por celdas de la grid se obtenga la variable a este nivel de agregación. Los cálculos de Goerlich y Cantarino (2015b) y de Reig, Goerlich y Cantarino (2016) consideraron esta aproximación. Se trata, sin embargo, de una aproximación tremendamente engorrosa de implementar,5 y que no mejora necesariamente las estimaciones.

Naturalmente there is no free lunch, y la solución concreta depende del problema particular.

Observación 3:

La utilización de una grid como distribución de referencia de la población supone adoptar una solución –implícita o explícita– sobre el tratamiento de las celdas borde.

No existe un tratamiento uniforme en la literatura sobre este tema.

4.2 El Nomenclátor de población del Instituto Nacional de Estadística (INE)

Desde el punto de vista histórico el Nomenclátor de Población es una relación –en principio exhaustiva– de las entidades de población de un municipio. Actualmente el INE publica el nomenclátor de población anualmente, con fecha de referencia 1 de enero, asociado a Padrón.

Visto desde esta perspectiva el Nomenclátor de Población parecería la fuente ideal si queremos disponer de información demográfica inframunicipal. ¡Veremos que no necesariamente es así!

Para algo de background en este contexto puedes leer la sección 3.2 de Goerlich y Cantarino (2012).

Si examinamos el Nomenclátor de Población de 2022 para Requena (46213) veremos la siguiente tabla que consta de 74 registros.

Tabla 1. Entidades de Población del Nomenclátor 2022 - Requena
Municipio
Entidad de Población
Código Nombre Código Nombre Población
46213 Requena 46213000000 REQUENA 20,058
46213 Requena 46213000100 AZAGADOR (EL) 41
46213 Requena 46213000101 AZAGADOR (EL) 41
46213 Requena 46213000400 BARRIO ARROYO 84
46213 Requena 46213000401 BARRIO ARROYO 84
46213 Requena 46213000500 CALDERÓN 30
46213 Requena 46213000501 CALDERÓN 30
46213 Requena 46213000600 CAMPO ARCIS 417
46213 Requena 46213000601 CAMPO ARCIS 415
46213 Requena 46213000699 DISEMINADO 2
46213 Requena 46213001000 CASAS DE CUADRA 9
46213 Requena 46213001001 CASAS DE CUADRA 9
46213 Requena 46213001100 CASAS DE EUFEMIA 96
46213 Requena 46213001101 CASAS DE EUFEMIA 96
46213 Requena 46213001400 PENEN DE ALBOSA 21
46213 Requena 46213001401 PENEN DE ALBOSA 20
46213 Requena 46213001402 SARDINEROS (LOS) 0
46213 Requena 46213001499 DISEMINADO 1
46213 Requena 46213001500 CASAS DE SOTOS 12
46213 Requena 46213001501 CASAS DE SOTOS 12
46213 Requena 46213001599 DISEMINADO 0
46213 Requena 46213001600 CASAS DEL RÍO 38
46213 Requena 46213001601 BARRIO DE SAN CASIMIRO 2
46213 Requena 46213001602 CASAS DEL RÍO 36
46213 Requena 46213001699 DISEMINADO 0
46213 Requena 46213001700 COJOS (LOS) 89
46213 Requena 46213001701 COJOS (LOS) 89
46213 Requena 46213001900 DERRAMADOR (EL) 53
46213 Requena 46213001901 DERRAMADOR (EL) 53
46213 Requena 46213001999 DISEMINADO 0
46213 Requena 46213002000 DUQUES (LOS) 92
46213 Requena 46213002001 DUQUES (LOS) 92
46213 Requena 46213002099 DISEMINADO 0
46213 Requena 46213002100 HORTUNAS 32
46213 Requena 46213002101 HORTUNAS 32
46213 Requena 46213002199 DISEMINADO 0
46213 Requena 46213002300 ISIDROS (LOS) 295
46213 Requena 46213002301 ISIDROS (LOS) 295
46213 Requena 46213002399 DISEMINADO 0
46213 Requena 46213002400 FUEN VICH 1
46213 Requena 46213002401 FUEN VICH 1
46213 Requena 46213002499 DISEMINADO 0
46213 Requena 46213002500 NOGUERAS (LAS) 14
46213 Requena 46213002501 NOGUERAS (LAS) 14
46213 Requena 46213002700 PEDRONES (LOS) 146
46213 Requena 46213002701 PEDRONES (LOS) 146
46213 Requena 46213002800 PONTÓN (EL) 477
46213 Requena 46213002801 PONTÓN (EL) 472
46213 Requena 46213002899 DISEMINADO 5
46213 Requena 46213002900 PORTERA (LA) 120
46213 Requena 46213002901 PORTERA (LA) 120
46213 Requena 46213002999 DISEMINADO 0
46213 Requena 46213003000 REBOLLAR (EL) 133
46213 Requena 46213003001 REBOLLAR (EL) 132
46213 Requena 46213003099 DISEMINADO 1
46213 Requena 46213003100 REQUENA 15,804
46213 Requena 46213003101 REQUENA 15,687
46213 Requena 46213003199 DISEMINADO 117
46213 Requena 46213003200 ROMA 81
46213 Requena 46213003201 ROMA 81
46213 Requena 46213003299 DISEMINADO 0
46213 Requena 46213003300 RUICES (LOS) 43
46213 Requena 46213003301 RUICES (LOS) 41
46213 Requena 46213003399 DISEMINADO 2
46213 Requena 46213003400 SAN ANTONIO 1,786
46213 Requena 46213003401 SAN ANTONIO 1,784
46213 Requena 46213003499 DISEMINADO 2
46213 Requena 46213003500 SAN JUAN 129
46213 Requena 46213003501 SAN JUAN 127
46213 Requena 46213003599 DISEMINADO 2
46213 Requena 46213003800 VILLAR DE OLMOS 15
46213 Requena 46213003801 CAÑADA (LA) 6
46213 Requena 46213003802 VILLAR DE OLMOS 9
46213 Requena 46213003899 DISEMINADO 0
Fuente: Nomenclátor de Población (INE) - Padrón Continuo


Resulta conveniente entender la estructura del nomenclátor, así como su formato de distribución, ya que dicha estadística tiene un marcado origen histórico que ha pervivido hasta nuestros días.

Las Entidades de Población del Nomenclátor tienen un código único formado por 11 dígitos, los 5 primeros corresponden al municipio, y los 6 restantes engloban los 3 niveles jerárquicos en los que se agrupan las entidades de población de un municipio:

  • Entidades Colectivas (EC): dígitos 6 y 7.

  • Entidades Singulares (ES): dígitos 8 y 9.

  • Núcleos y Diseminados (ND): dígitos 10 y 11.

Puedes ver como el primer registro del nomenclátor es el Municipio, por lo que el código asociado es todo 0´s después de los primeros 5 dígitos, lo que representan en código municipal.

Las Entidades Colectivas no existen en muchas Comunidades Autónomas (CCAA) –tiene un marcado carácter histórico– y no son exhaustivas del municipio, en el sentido que sumando la población de todas las Entidades Colectivas del nomenclátor no obtenemos la población de España.

En Requena (46213) –en realidad en la Comunidad Valenciana– no existen Entidades Colectivas. Puedes ver en la tabla 1 como los dígitos 6 y 7 son siempre 00.

Observación 4:

Lo mejor que puedes hacer con las Entidades Colectivas del Nomenclátor de Población es olvidarte de ellas, 😄.

A todos los efectos prácticos el nomenclátor de Población tiene dos niveles jerárquicos exhaustivos: (i) Entidades Singulares, y (ii) Núcleos y Diseminados.

Así pues, el primer nivel jerárquico en términos de Entidades de Población por debajo del municipio son las Entidades Singulares.

Las Entidades Singulares son exhaustivas del municipio –la población del municipio se asigna las Entidades Singulares del mismo y sumando la población de todas las Entidades Singulares obtendremos la población de España–. Todo municipio tendrá, al menos, 1 Entidad Singular. En Requena (46213) encontramos 26 Entidades Singulares, todas ellas con población, que se muestran en la tabla 2.

Tabla 2. Entidades Singulares del Nomenclátor 2022 - Requena
Municipio
Entidad Singular
Código Nombre Código Nombre Población
46213 Requena 46213000100 AZAGADOR (EL) 41
46213 Requena 46213000400 BARRIO ARROYO 84
46213 Requena 46213000500 CALDERÓN 30
46213 Requena 46213000600 CAMPO ARCIS 417
46213 Requena 46213001000 CASAS DE CUADRA 9
46213 Requena 46213001100 CASAS DE EUFEMIA 96
46213 Requena 46213001400 PENEN DE ALBOSA 21
46213 Requena 46213001500 CASAS DE SOTOS 12
46213 Requena 46213001600 CASAS DEL RÍO 38
46213 Requena 46213001700 COJOS (LOS) 89
46213 Requena 46213001900 DERRAMADOR (EL) 53
46213 Requena 46213002000 DUQUES (LOS) 92
46213 Requena 46213002100 HORTUNAS 32
46213 Requena 46213002300 ISIDROS (LOS) 295
46213 Requena 46213002400 FUEN VICH 1
46213 Requena 46213002500 NOGUERAS (LAS) 14
46213 Requena 46213002700 PEDRONES (LOS) 146
46213 Requena 46213002800 PONTÓN (EL) 477
46213 Requena 46213002900 PORTERA (LA) 120
46213 Requena 46213003000 REBOLLAR (EL) 133
46213 Requena 46213003100 REQUENA 15,804
46213 Requena 46213003200 ROMA 81
46213 Requena 46213003300 RUICES (LOS) 43
46213 Requena 46213003400 SAN ANTONIO 1,786
46213 Requena 46213003500 SAN JUAN 129
46213 Requena 46213003800 VILLAR DE OLMOS 15
Fuente: Nomenclátor de Población (INE) - Padrón Continuo


A efectos demográficos, cada Entidad Singular se divide en Núcleos –ninguno, uno o varios– y Diseminado –ninguno o uno–. Es decir, cada Entidad Singular tendrá al menos un núcleo o diseminado, pudiendo tener varios núcleos pero solo un diseminado, en el caso de que lo tenga. Así pues, el diseminado, de existir, se define a nivel de Entidad Singular, y no puede existir más de un diseminado por cada Entidad Singular. Su código es siempre 99.

Las situaciones aquí son bastante heterogéneas. Existen Entidades Singulares sin núcleos y con toda su población en diseminado, y otras sin diseminado y con toda su población en uno o varios núcleos. Los núcleos y diseminados serán al menos tantos como las Entidades Singulares del municipio, y representan la mayor desagregación posible en este contexto. Núcleos y diseminados son exhaustivos del municipio –la población del municipio se asigna las Entidades Singulares del mismo, y esta a núcleos y/o diseminados, y sumando la población de todos los núcleos y diseminados obtendremos la población de España–.

En Requena (46213) encontramos 47 núcleos y diseminados, pero curiosamente no todos tienen población. Existen 10 diseminados y un núcleo, Los Sardineros (46213001402) de la Entidad Singular Penén de Albosa (46213001400), que carecen de población en 2022. Por tanto, a efectos demográficos solo tenemos 36 núcleos y diseminados con población, que se muestran en la tabla 3.

Tabla 3. Núcleos y Diseminados del Nomenclátor 2022 - Requena
Municipio
Núcleo o Diseminado
Código Nombre Código Nombre Población
46213 Requena 46213000101 AZAGADOR (EL) 41
46213 Requena 46213000401 BARRIO ARROYO 84
46213 Requena 46213000501 CALDERÓN 30
46213 Requena 46213000601 CAMPO ARCIS 415
46213 Requena 46213000699 DISEMINADO 2
46213 Requena 46213001001 CASAS DE CUADRA 9
46213 Requena 46213001101 CASAS DE EUFEMIA 96
46213 Requena 46213001401 PENEN DE ALBOSA 20
46213 Requena 46213001499 DISEMINADO 1
46213 Requena 46213001501 CASAS DE SOTOS 12
46213 Requena 46213001601 BARRIO DE SAN CASIMIRO 2
46213 Requena 46213001602 CASAS DEL RÍO 36
46213 Requena 46213001701 COJOS (LOS) 89
46213 Requena 46213001901 DERRAMADOR (EL) 53
46213 Requena 46213002001 DUQUES (LOS) 92
46213 Requena 46213002101 HORTUNAS 32
46213 Requena 46213002301 ISIDROS (LOS) 295
46213 Requena 46213002401 FUEN VICH 1
46213 Requena 46213002501 NOGUERAS (LAS) 14
46213 Requena 46213002701 PEDRONES (LOS) 146
46213 Requena 46213002801 PONTÓN (EL) 472
46213 Requena 46213002899 DISEMINADO 5
46213 Requena 46213002901 PORTERA (LA) 120
46213 Requena 46213003001 REBOLLAR (EL) 132
46213 Requena 46213003099 DISEMINADO 1
46213 Requena 46213003101 REQUENA 15,687
46213 Requena 46213003199 DISEMINADO 117
46213 Requena 46213003201 ROMA 81
46213 Requena 46213003301 RUICES (LOS) 41
46213 Requena 46213003399 DISEMINADO 2
46213 Requena 46213003401 SAN ANTONIO 1,784
46213 Requena 46213003499 DISEMINADO 2
46213 Requena 46213003501 SAN JUAN 127
46213 Requena 46213003599 DISEMINADO 2
46213 Requena 46213003801 CAÑADA (LA) 6
46213 Requena 46213003802 VILLAR DE OLMOS 9
Fuente: Nomenclátor de Población (INE) - Padrón Continuo


Finalmente es importante saber que las Entidades Poblacionales del Nomenclátor no tienen superficie asignada, de forma que representan una división demográfica del municipio, pero no una división territorial.

Observación 5:

Las Entidades del Nomenclátor de Población no tienen superficie asignada, por lo que no constituyen una división territorial del municipio.

La pregunta clave ahora es, ¿podemos localizar sobre el término municipal las entidades de población? Puesto que no tienen superficie asignada, no hay polígonos asociados, y en consecuencia la pregunta se traduce a si disponemos de coordenadas para las entidades del Nomenclátor de Población, de la misma forma que disponíamos de coordenadas representativas del municipio –donde se sitúa la capital o el núcleo principal–. La respuesta es, en principio, si.

El IGN dispone de un Nomenclátor Geográfico de Municipios y Entidades de Población que, en principio, proporciona coordenadas para estas entidades, al igual que para los municipios o las capitales de municipios, tal y como mostramos al principio de estas notas. El Nomenclátor Geográfico de Entidades de Población del IGN para el municipio de Requena (46213) se muestra en la tabla 4, y tiene 83 registros, ¡9 más que el Nomenclátor de Población del INE, ❓!

Tabla 4. Entidades del Nomenclátor Geográfico del IGN - Requena
Municipio
Entidad de Población

Coordenadas1

Código Nombre Código Nombre Tipo Longitud Latitud
46213 Requena 46213000000 Requena Municipio -1.100270 39.48606
46213 Requena 46213000100 El Azagador Entidad singular -1.141397 39.48512
46213 Requena 46213000101 El Azagador Otras entidades -1.141397 39.48512
46213 Requena 46213000300 El Barriete Entidad singular -1.143436 39.51444
46213 Requena 46213000301 El Barriete Otras entidades -1.143436 39.51444
46213 Requena 46213000400 Barrio Arroyo Entidad singular -1.165219 39.51658
46213 Requena 46213000401 Barrio Arroyo Otras entidades -1.165219 39.51658
46213 Requena 46213000500 Calderón Entidad singular -1.185465 39.52978
46213 Requena 46213000501 Calderón Otras entidades -1.185465 39.52978
46213 Requena 46213000600 Campo Arcís Entidad singular -1.167820 39.43085
46213 Requena 46213000601 Campo Arcís Otras entidades -1.167820 39.43085
46213 Requena 46213000699 Campo Arcís Diseminado -1.167820 39.43085
46213 Requena 46213001000 Casas de Cuadra Entidad singular -1.255008 39.45201
46213 Requena 46213001001 Casas de Cuadra Otras entidades -1.255008 39.45201
46213 Requena 46213001100 Casas de Eufemia Entidad singular -1.211501 39.44910
46213 Requena 46213001101 Casas de Eufemia Otras entidades -1.211501 39.44910
46213 Requena 46213001400 Penén de Albosa Entidad singular -1.276213 39.40367
46213 Requena 46213001401 Penén de Albosa Otras entidades -1.276213 39.40367
46213 Requena 46213001402 Los Sardineros Otras entidades -1.245916 39.37572
46213 Requena 46213001499 Penén de Albosa Diseminado -1.276023 39.40433
46213 Requena 46213001500 Casas de Sotos Entidad singular -1.064601 39.33187
46213 Requena 46213001501 Casas de Sotos Otras entidades -1.064601 39.33187
46213 Requena 46213001599 Casas de Sotos Diseminado -1.064601 39.33187
46213 Requena 46213001600 Casas del Río Entidad singular -1.133645 39.29642
46213 Requena 46213001601 Barrio de San Casimiro Otras entidades -1.143451 39.29965
46213 Requena 46213001602 Casas del Río Otras entidades -1.133645 39.29642
46213 Requena 46213001699 Casas del Río Diseminado -1.133645 39.29642
46213 Requena 46213001700 Los Cojos Entidad singular -1.307237 39.42125
46213 Requena 46213001701 Los Cojos Otras entidades -1.307237 39.42125
46213 Requena 46213001800 Los Chicanos Entidad singular -1.141051 39.51122
46213 Requena 46213001801 Los Chicanos Otras entidades -1.141051 39.51122
46213 Requena 46213001899 Los Chicanos Diseminado -1.141051 39.51122
46213 Requena 46213001900 El Derramador Entidad singular -1.153355 39.49459
46213 Requena 46213001901 El Derramador Otras entidades -1.153355 39.49459
46213 Requena 46213001999 El Derramador Diseminado -1.153355 39.49459
46213 Requena 46213002000 Los Duques Entidad singular -1.205474 39.43536
46213 Requena 46213002001 Los Duques Otras entidades -1.205474 39.43536
46213 Requena 46213002099 Los Duques Diseminado -1.205474 39.43536
46213 Requena 46213002100 Hortunas Entidad singular -1.045537 39.39147
46213 Requena 46213002101 Hortunas Otras entidades -1.045537 39.39147
46213 Requena 46213002199 Hortunas Diseminado -1.045537 39.39147
46213 Requena 46213002300 Los Isidros Entidad singular -1.292395 39.42013
46213 Requena 46213002301 Los Isidros Otras entidades -1.292395 39.42013
46213 Requena 46213002399 Los Isidros Diseminado -1.292395 39.42013
46213 Requena 46213002400 Fuen Vich Entidad singular -1.056472 39.35223
46213 Requena 46213002401 Fuen Vich Otras entidades -1.056472 39.35223
46213 Requena 46213002499 Fuen Vich Diseminado -1.056472 39.35223
46213 Requena 46213002500 Las Nogueras Entidad singular -1.084802 39.58564
46213 Requena 46213002501 Las Nogueras Otras entidades -1.084802 39.58564
46213 Requena 46213002600 Los Ochandos Entidad singular -1.149256 39.51759
46213 Requena 46213002601 Los Ochandos Otras entidades -1.149256 39.51759
46213 Requena 46213002700 Los Pedrones Entidad singular -1.083197 39.33488
46213 Requena 46213002701 Los Pedrones Otras entidades -1.083197 39.33488
46213 Requena 46213002800 El Pontón Entidad singular -1.120132 39.47604
46213 Requena 46213002801 El Pontón Otras entidades -1.120132 39.47604
46213 Requena 46213002899 El Pontón Diseminado -1.120132 39.47604
46213 Requena 46213002900 La Portera Entidad singular -1.102035 39.40186
46213 Requena 46213002901 La Portera Otras entidades -1.102035 39.40186
46213 Requena 46213002999 La Portera Diseminado -1.102035 39.40186
46213 Requena 46213003000 El Rebollar Entidad singular -1.011071 39.46836
46213 Requena 46213003001 El Rebollar Otras entidades -1.011071 39.46836
46213 Requena 46213003099 El Rebollar Diseminado -1.011071 39.46836
46213 Requena 46213003100 Requena Entidad singular -1.100270 39.48606
46213 Requena 46213003101 Requena Capital de municipio -1.100270 39.48606
46213 Requena 46213003199 Requena Diseminado -1.100270 39.48606
46213 Requena 46213003200 Roma Entidad singular -1.157688 39.50664
46213 Requena 46213003201 Roma Otras entidades -1.157688 39.50664
46213 Requena 46213003299 Roma Diseminado -1.157688 39.50664
46213 Requena 46213003300 Los Ruices Entidad singular -1.255457 39.47589
46213 Requena 46213003301 Los Ruices Otras entidades -1.255457 39.47589
46213 Requena 46213003399 Los Ruices Diseminado -1.255457 39.47589
46213 Requena 46213003400 San Antonio Entidad singular -1.149697 39.52291
46213 Requena 46213003401 San Antonio Otras entidades -1.149697 39.52291
46213 Requena 46213003499 San Antonio Diseminado -1.149697 39.52291
46213 Requena 46213003500 San Juan Entidad singular -1.172961 39.52301
46213 Requena 46213003501 San Juan Otras entidades -1.172961 39.52301
46213 Requena 46213003599 San Juan Diseminado -1.172961 39.52301
46213 Requena 46213003700 Turquía Entidad singular -1.154481 39.52061
46213 Requena 46213003701 Turquía Otras entidades -1.154481 39.52061
46213 Requena 46213003800 Villar de Olmos Entidad singular -1.061345 39.59589
46213 Requena 46213003801 La Cañada Otras entidades -1.067838 39.60113
46213 Requena 46213003802 Villar de Olmos Otras entidades -1.061345 39.59589
46213 Requena 46213003899 Villar de Olmos Diseminado -1.061345 39.59589
1 Coordenadas geográficas en ETRS89
Fuente: Nomenclátor Geográfico de Entidades de Población (IGN)


Lamentablemente los nomenclátores del INE y del IGN no están coordinados. La razón es un poco un misterio, pero la raíz de la cuestión puede deberse a que el Nomenclátor de Población del INE está preocupado por la población –¡aunque incluye entidades sin población!– mientras que Nomenclátor Geográfico del IGN está más bien preocupado por los edificios, estén o no habitados. Sea como fuere, es posible encontrarnos con situaciones en las que algunas de las entidades en el Nomenclátor de Población del INE no tengan coordenada asignada en el Nomenclátor Geográfico del IGN.

En el caso particular de Requena (46213) todas las Entidades del Nomenclátor de Población del INE tiene su correspondencia en el Nomenclátor Geográfico del IGN, y en consecuencia podemos asignar coordenadas a toda la población.

El Nomenclátor Geográfico del IGN ofrece coordenadas para 30 Entidades Singulares que se ofrecen en la tabla 5. Las coordenadas corresponden a las Entidades Singulares de la tabla 2 más 4 adicionales.

Tabla 5. Entidades Singulares del Nomenclátor Geográfico del IGN - Requena
Municipio
Entidad Singular

Coordenadas1

Código Nombre Código Nombre Tipo Longitud Latitud
46213 Requena 46213000100 El Azagador Entidad singular -1.141397 39.48512
46213 Requena 46213000300 El Barriete Entidad singular -1.143436 39.51444
46213 Requena 46213000400 Barrio Arroyo Entidad singular -1.165219 39.51658
46213 Requena 46213000500 Calderón Entidad singular -1.185465 39.52978
46213 Requena 46213000600 Campo Arcís Entidad singular -1.167820 39.43085
46213 Requena 46213001000 Casas de Cuadra Entidad singular -1.255008 39.45201
46213 Requena 46213001100 Casas de Eufemia Entidad singular -1.211501 39.44910
46213 Requena 46213001400 Penén de Albosa Entidad singular -1.276213 39.40367
46213 Requena 46213001500 Casas de Sotos Entidad singular -1.064601 39.33187
46213 Requena 46213001600 Casas del Río Entidad singular -1.133645 39.29642
46213 Requena 46213001700 Los Cojos Entidad singular -1.307237 39.42125
46213 Requena 46213001800 Los Chicanos Entidad singular -1.141051 39.51122
46213 Requena 46213001900 El Derramador Entidad singular -1.153355 39.49459
46213 Requena 46213002000 Los Duques Entidad singular -1.205474 39.43536
46213 Requena 46213002100 Hortunas Entidad singular -1.045537 39.39147
46213 Requena 46213002300 Los Isidros Entidad singular -1.292395 39.42013
46213 Requena 46213002400 Fuen Vich Entidad singular -1.056472 39.35223
46213 Requena 46213002500 Las Nogueras Entidad singular -1.084802 39.58564
46213 Requena 46213002600 Los Ochandos Entidad singular -1.149256 39.51759
46213 Requena 46213002700 Los Pedrones Entidad singular -1.083197 39.33488
46213 Requena 46213002800 El Pontón Entidad singular -1.120132 39.47604
46213 Requena 46213002900 La Portera Entidad singular -1.102035 39.40186
46213 Requena 46213003000 El Rebollar Entidad singular -1.011071 39.46836
46213 Requena 46213003100 Requena Entidad singular -1.100270 39.48606
46213 Requena 46213003200 Roma Entidad singular -1.157688 39.50664
46213 Requena 46213003300 Los Ruices Entidad singular -1.255457 39.47589
46213 Requena 46213003400 San Antonio Entidad singular -1.149697 39.52291
46213 Requena 46213003500 San Juan Entidad singular -1.172961 39.52301
46213 Requena 46213003700 Turquía Entidad singular -1.154481 39.52061
46213 Requena 46213003800 Villar de Olmos Entidad singular -1.061345 39.59589
1 Coordenadas geográficas en ETRS89
Fuente: Nomenclátor Geográfico de Entidades de Población (IGN)


Comparación con la tabla 2 muestra que las Entidades Singulares para las que tenemos coordenadas, pero carecen de población son El Barriete (46213000300), Los Chicanos (46213001800), Los Ochandos (46213002600) y Turquía (46213003700).

Inspección visual muestra también que estas coordenadas son diferentes, ¡que es lo que debe ser, 👍! ¡La población de entidades diferentes está en lugares diferentes!

El mapa 5 muestra las coordenadas de las 26 Entidades Singulares que aparecen en el Nomenclátor de Población del INE –las de la tabla 2–. Puede observarse como la población se localiza dentro del municipio con mucha precisión, aunque en la Entidad Singular principal, Requena (46213003100), tenemos un solo punto que representa el 78% de la población.

Mapa 5 - Entidades Singulares - Requena

¿Y si bajamos al máximo nivel de desagregación –núcleos y diseminados–? En principio deberíamos ganar en resolución, pero no parece que vaya a ser siempre así.

El Nomenclátor Geográfico del IGN ofrece coordenadas para los 52 núcleos y diseminados que se ofrecen en la tabla 6. Las coordenadas corresponden a los 36 núcleos y diseminados de la tabla 3, más los 11 para los que el INE consigna población nula –tabla 1–, más 4 núcleos y un diseminado de las 4 Entidades Singulares que no aparecen en el INE –El Barriete (46213000301), Los Chicanos (46213001801 y 46213001899), Los Ochandos (46213002601) y Turquía (46213003701)–.

Tabla 6 - Núcleos y Diseminados del Nomenclátor Geográfico del IGN - Requena
Municipio
Núcleo o Diseminado

Coordenadas1

Código Nombre Código Nombre Tipo Longitud Latitud
46213 Requena 46213000101 El Azagador Otras entidades -1.141397 39.48512
46213 Requena 46213000301 El Barriete Otras entidades -1.143436 39.51444
46213 Requena 46213000401 Barrio Arroyo Otras entidades -1.165219 39.51658
46213 Requena 46213000501 Calderón Otras entidades -1.185465 39.52978
46213 Requena 46213000601 Campo Arcís Otras entidades -1.167820 39.43085
46213 Requena 46213000699 Campo Arcís Diseminado -1.167820 39.43085
46213 Requena 46213001001 Casas de Cuadra Otras entidades -1.255008 39.45201
46213 Requena 46213001101 Casas de Eufemia Otras entidades -1.211501 39.44910
46213 Requena 46213001401 Penén de Albosa Otras entidades -1.276213 39.40367
46213 Requena 46213001402 Los Sardineros Otras entidades -1.245916 39.37572
46213 Requena 46213001499 Penén de Albosa Diseminado -1.276023 39.40433
46213 Requena 46213001501 Casas de Sotos Otras entidades -1.064601 39.33187
46213 Requena 46213001599 Casas de Sotos Diseminado -1.064601 39.33187
46213 Requena 46213001601 Barrio de San Casimiro Otras entidades -1.143451 39.29965
46213 Requena 46213001602 Casas del Río Otras entidades -1.133645 39.29642
46213 Requena 46213001699 Casas del Río Diseminado -1.133645 39.29642
46213 Requena 46213001701 Los Cojos Otras entidades -1.307237 39.42125
46213 Requena 46213001801 Los Chicanos Otras entidades -1.141051 39.51122
46213 Requena 46213001899 Los Chicanos Diseminado -1.141051 39.51122
46213 Requena 46213001901 El Derramador Otras entidades -1.153355 39.49459
46213 Requena 46213001999 El Derramador Diseminado -1.153355 39.49459
46213 Requena 46213002001 Los Duques Otras entidades -1.205474 39.43536
46213 Requena 46213002099 Los Duques Diseminado -1.205474 39.43536
46213 Requena 46213002101 Hortunas Otras entidades -1.045537 39.39147
46213 Requena 46213002199 Hortunas Diseminado -1.045537 39.39147
46213 Requena 46213002301 Los Isidros Otras entidades -1.292395 39.42013
46213 Requena 46213002399 Los Isidros Diseminado -1.292395 39.42013
46213 Requena 46213002401 Fuen Vich Otras entidades -1.056472 39.35223
46213 Requena 46213002499 Fuen Vich Diseminado -1.056472 39.35223
46213 Requena 46213002501 Las Nogueras Otras entidades -1.084802 39.58564
46213 Requena 46213002601 Los Ochandos Otras entidades -1.149256 39.51759
46213 Requena 46213002701 Los Pedrones Otras entidades -1.083197 39.33488
46213 Requena 46213002801 El Pontón Otras entidades -1.120132 39.47604
46213 Requena 46213002899 El Pontón Diseminado -1.120132 39.47604
46213 Requena 46213002901 La Portera Otras entidades -1.102035 39.40186
46213 Requena 46213002999 La Portera Diseminado -1.102035 39.40186
46213 Requena 46213003001 El Rebollar Otras entidades -1.011071 39.46836
46213 Requena 46213003099 El Rebollar Diseminado -1.011071 39.46836
46213 Requena 46213003101 Requena Capital de municipio -1.100270 39.48606
46213 Requena 46213003199 Requena Diseminado -1.100270 39.48606
46213 Requena 46213003201 Roma Otras entidades -1.157688 39.50664
46213 Requena 46213003299 Roma Diseminado -1.157688 39.50664
46213 Requena 46213003301 Los Ruices Otras entidades -1.255457 39.47589
46213 Requena 46213003399 Los Ruices Diseminado -1.255457 39.47589
46213 Requena 46213003401 San Antonio Otras entidades -1.149697 39.52291
46213 Requena 46213003499 San Antonio Diseminado -1.149697 39.52291
46213 Requena 46213003501 San Juan Otras entidades -1.172961 39.52301
46213 Requena 46213003599 San Juan Diseminado -1.172961 39.52301
46213 Requena 46213003701 Turquía Otras entidades -1.154481 39.52061
46213 Requena 46213003801 La Cañada Otras entidades -1.067838 39.60113
46213 Requena 46213003802 Villar de Olmos Otras entidades -1.061345 39.59589
46213 Requena 46213003899 Villar de Olmos Diseminado -1.061345 39.59589
1 Coordenadas geográficas en ETRS89
Fuente: Nomenclátor Geográfico de Entidades de Población (IGN)


Examinando con cierto cuidado las coordenadas de las tablas anteriores observamos que, normalmente, las coordenadas del diseminado coinciden con las de la Entidad Singular a la que pertenecen –aunque no siempre es así, por ejemplo, el diseminado de Penén de Albosa (46213001499) tiene coordenadas diferentes de su Entidad Singular (46213001400) y de su núcleo (46213001401), sin embargo, las de estos dos últimos coinciden–. Esto resulta natural, ya que no está muy claro cual es el sentido de las coordenadas de un diseminado que, por definición, está disperso.6

Por otra parte, las coordenadas de los núcleos coinciden, normalmente, con las de la Entidad Singular a la que pertenecen, aunque naturalmente si hay más de un núcleo suelen tener coordenadas diferentes.

Como resultado de esto existen muchas coordenadas duplicadas dentro de los núcleos y diseminados. En el ejemplo de Requena (46213) existen 26 coordenadas para las Entidades Singulares –Mapa 5–, y solo 29 coordenadas diferentes para la capa de núcleos y diseminados, que son las que se ofrecen en el Mapa 6.7

Mapa 6 - Núcleos y Diseminados - Requena

El resumen es que no parece que ganemos mucho bajando hasta los núcleos y diseminados.

Observación 6:

Si hemos de utilizar las coordenadas de las entidades del Nomenclátor parece razonable quedarse a nivel de Entidad Singular, ya que bajar a nivel de núcleo y diseminado no suele añadir variabilidad en la dispersión de la población dentro del municipio.

Si quisiéramos polígonos a partir de las coordenadas de las entidades de población, ajustados a los lindes municipales, siempre es posible construirlos a partir de las coordenadas mediante una teselación de Voronoi, st_voronoi, aunque deberemos tener en cuenta que dichos polígonos no tienen nada que ver con la orografía, que es la determinante de los asentamientos de población.8 Más adelante veremos como podemos disponer de polígonos que representen las edificaciones asociadas a las entidades de población.

4.2.1 Nomenclátor: Pros

  • En principio, el nomenclátor proporciona un listado exhaustivo de entidades de población sobre el territorio, proporcionando información sobre población de dichas entidades, INE, y características físicas de las mismas –altitud y coordenadas–, IGN.

4.1.2 Nomenclátor: Cons

  • Los nomenclátores del INE –población– y del IGN –geográfico– no están totalmente sincronizados, de forma que no encontramos siempre las mismas entidades en ambos.

  • Como consecuencia de lo anterior, no hay garantía de que todas las entidades que aparecen en el Nomenclátor de Población del INE tengan coordenadas en el Nomenclátor Geográfico del IGN.

  • Las entidades del nomenclátor no tienen superficie asociada, de forma que la identificación geográfica es como coordenada puntual.

  • La gestión del nomenclátor depende de los ayuntamientos –al igual que el callejero– por lo que se deja ver en el mismo las prácticas administrativas y costumbres históricas de las diversas partes de España. Por ejemplo, el Madrid (28079), que es el municipio con más población tiene una sola Entidad Singular, un solo núcleo y ningún diseminado, mientras que municipios mucho más pequeños de Galicia llegan a tener hasta cientos de Entidades Singulares y diseminados. Estas discrepancias reflejan no solo diferencias en las estructuras de asentamiento de la población, sino diferentes prácticas administrativas a la hora de definir las entidades.

  • Si un gran núcleo urbano se identifica como una sola entidad en el nomenclátor tendremos para él 1 sola coordenada, de forma que no ganamos mucho en distribución de la población inframunicipal.

4.3 Las Secciones Censales del Instituto Nacional de Estadística

Una división exhaustiva del término municipal con población asociada son las Secciones Censales, gestionadas por los Ayuntamientos –al igual que el callejero–, pero coordinadas por el INE –de forma similar al Padrón–.

Las secciones censales son unidades estadísticas utilizadas en la gestión del Censo Electoral, además de constituir, normalmente, las unidades primarias en el muestreo estadístico del INE en las encuestas a hogares. Su población está acotada por las necesidades de gestión del Censo Electoral, de forma que no suelen exceder los 2500 electores –personas en la práctica–, sin embargo, son muy heterogéneas en tamaño, proporcionando una gran resolución en contextos urbanos, pero muy poca en ambientes rurales.

La codificación de las secciones censales consta de 10 dígitos. Los 5 primeros corresponden al municipio, los 2 siguientes al Distrito Electoral y los 3 últimos a la Sección Censal propiamente dicha. En este caso es irrelevante utilizar los distritos, por lo que nos centraremos en las secciones censales.

Para algo de background en este contexto puedes leer la sección 3.3 de Goerlich y Cantarino (2012).

Requena (46213) tiene, según el Padrón de 2022, 13 secciones censales que se muestran en la tabla 7.

Las dos características que conviene resaltar aquí son:

(i) su homogeneidad en términos de población –que oscila entre los 2 486 habitantes la sección más grande y 764 la más pequeña– y

(ii) su heterogeneidad en términos de superficie –que oscila entre las 7 ha la más pequeña y los 383.4 km² la más grande–.

Tabla 7 - Secciones Censales 2022 - Requena
Municipio
Código Nombre Sección Censal Población Superficie (km²)
46213 Requena 4621301001 2,128 15.111
46213 Requena 4621301002 2,486 105.758
46213 Requena 4621301003 1,211 75.092
46213 Requena 4621302002 1,303 0.152
46213 Requena 4621302003 1,782 3.972
46213 Requena 4621302004 1,679 0.070
46213 Requena 4621302005 1,322 0.805
46213 Requena 4621302006 1,863 0.272
46213 Requena 4621302007 2,158 0.433
46213 Requena 4621303001 1,786 45.741
46213 Requena 4621303002 910 54.593
46213 Requena 4621303003 666 128.845
46213 Requena 4621304001 764 383.400
Fuente: Estadística del Padrón Continuo (INE)


Necesitamos algo más, saber donde están –físicamente– las secciones censales. Es decir, necesitamos una capa vectorial de secciones censales que nos ponga la población en el mapa, aunque sea en forma de areal data, es decir, como si la población ocupara, de forma uniforme, todo el área de la Sección Censal. Dicha capa se puede obtener también del INE, bien en formato shape o bien vía Web Feature Service (WFS).9

El mapa 7 muestra la geografía de las secciones censales de Requena (46213) y permite comprobar como se adaptan a la distribución de la población. Pinchando sobre una sección censal podrás ver su población y su superficie, además de su código. En el núcleo urbano principal las secciones tienden a ser pequeñas y densamente pobladas, pero conforme nos alejamos de dicho núcleo las secciones censales son grandes y gran parte del territorio está vacío. La situación no es muy diferente de lo que mostrábamos en el mapa 1 respecto al municipio en su conjunto.

Mapa 7 - Secciones Censales 2022 - Requena

Si todo lo que necesitamos es situar la población de las secciones censales sobre un polígono exhaustivo del término municipal hemos acabado, pero si lo que queremos es un punto representativo de la población dentro de la sección censal estamos en el punto de partida –apartado 3–, solo que ahora hemos cambiado los municipios por las secciones censales.

Naturalmente siempre podemos calcular un centroide geométrico de cada sección censal al igual que hicimos con el municipio –mapa 2–. Estos centroides se representan en el mapa 8.

Mapa 8 - Centroides de las Secciones Censales 2022 - Requena

¿Serían estos puntos representativos de la localización de la población de la sección censal? No.

Podemos observar en el mapa 8 como los centroides no caen en los núcleos de población, salvo en el caso de las secciones censales del núcleo urbano. Incluso aquí, si la sección censal se extiende más allá del casco urbano el centroide cae normalmente fuera de él. ¡Observa el caso extremo de la Sección Censal 4621301003!

La inspección visual del mapa 8 muestra que, en la mayoría de los casos, los centroides caen en medio de la nada, lo que nos lleva de nuevo a la observación 1 de que los centroides de polígonos no son puntos representativos de nuestra variable de interés –la población–.

Sin embargo, ahora el IGN no viene a nuestro rescate. El IGN ofrece coordenadas de los municipios y sus capitales, pero no de las secciones censales.

¿Podemos obtener un punto representativo de la localización de la población de la sección censal? Si, pero requiere algo de trabajo e información auxiliar adicional. Solucionaremos este problema en el apartado siguiente.

Observación 7:

No existe, como tal, un punto representativo de donde situar la población de las secciones censales –al contrario de lo que sucede con los municipios–.

Buscar este punto requiere información auxiliar, ¡y algo de trabajo!

4.3.1 Secciones Censales: Pros

  • Las secciones censales constituyen una división exhaustiva del término municipal y son relativamente homogéneas en términos demográficos.

  • Proporcionan mucha resolución en el mundo urbano, con elevada densidad de población, dado que allí las secciones son pequeñas.

4.3.2 Secciones Censales: Cons

  • Son muy heterogéneas en términos de superficie.

  • Proporcionan escasa resolución en el mundo rural, con baja densidad de población.

  • Aproximadamente el 70% de los municipios tiene una sección censal, por lo que en muchos casos no proporciona más información, en términos de distribución de la población, que la división municipal.

4.4 Summing-up

Hemos examinado 3 fuentes de información demográfica inframunicipal.

¿Hay elección óptima? No.

Podríamos preguntarnos que información es más adecuada, pero there is no free lunch y cada caso debe ser tratado por sus propios méritos, aunque naturalmente es posible dar unas pinceladas generales.

En términos de distribución de la población –puntos de población– la grid es probablemente la capa que proporcionan un mayor número de puntos donde situar la población, y con una resolución de 1km \(\times\) 1km proporciona un equilibrio adecuado entre el mundo rural y el mundo urbano. En nuestro ejemplo la grid tiene 44 celdas –44 puntos de población–, aunque solo 35 son interiores. Son más puntos de población de los que obtenemos para las Entidades Singulares –26 coordenadas– o para las secciones censales –13–. ¡Aunque aquí de momento solo tenemos polígonos!

En este sentido la grid proporciona el mejor equilibrio para estudios de amplio espectro. Además, tiene la ventaja de que las unidades son uniformes. En ambientes rurales las coordenadas del nomenclátor proporcionan mayor resolución –aunque la situación es muy heterogénea según municipios–, pero sin duda estas no son apropiadas en absoluto para contextos urbanos, aquí las secciones censales son claramente superiores. Aumentar la fineza en ambas direcciones –el mundo rural y el urbano– requeriría, por ejemplo, aumentar la resolución de la grid hasta un tamaño de celda de 100m \(\times\) 100m, aunque entonces los problemas de cómputo pueden ser considerables.

Idealmente desearíamos tener la población geo-referenciada. Lo que en la práctica significa disponer de las coordenadas de todas las direcciones postales donde hay población residente –empadronada– y la población que vive en cada dirección postal. Lo que el INE llama aproximaciones postales (apps)10 en la gestión actual del callejero del Censo Electoral. En este caso tendríamos algo más de 12 millones de puntos, prácticamente imposibles de manejar en su conjunto con la resolución original, pero que podríamos agregar a nuestro gusto o según nuestras necesidades.

5. ¿Cual es ahora exactamente nuestro problema?

Una vez repasada la información demográfica inframunicipal podemos acotar nuestro problema.11

Problema:

Buscar un punto representativo –coordenada– donde situar la población de las secciones censales.

Resolver este problema requiere información auxiliar.

En nuestro caso concreto la información puede proceder de dos fuentes: (i) coberturas/usos del suelo o (ii) edificaciones.

Aunque al final buscamos lo mismo. Polígonos residenciales, dentro de la sección censal, donde localizar la población y a partir de ellos calcular un centroide. ¡Esta es la filosofía general!

Ilustraremos la solución de este problema para Requena (46213) a partir de ambas fuentes de información.

  1. Coberturas/usos del suelo. Este tipo de información procede del Sistema de Información de Ocupación del Suelo de España (SIOSE), cuya última versión completa es de 2014, SIOSE2014.12 Está disponible en el Centro de Descargas del CNIG por CCAA, y la información que utilizaremos ya fue tratada en Goerlich (2023a), por lo que está lista para su uso.

  2. Edificaciones. Este tipo de información procede de la Información Geográfica de Referencia (IGR) Poblaciones (IGR-PO) proporcionada por el IGN y disponible en el Centro de Descargas del CNIG.

¿Existen más fuentes de información para este ejercicio? Si, por ejemplo Catastro (Goerlich 2023b) o el Modelo Digital de Superficies de Edificación –MDSnE2,5– del IGN, pero son más complejas de manejar, no es evidente que presenten mejoras sustanciales para este caso concreto y en este ejercicio valoramos en gran medida la simplicidad.

Una vez destripado el problema para Requena (46213) ilustraremos brevemente su solución para la Comunidad Valenciana a partir de SIOSE2014, indicando problemas potenciales que nos podemos encontrar y posibilidades de mejora. Este ejercicio está resuelto en el project de R que acompaña a estas notas.

Naturalmente es posible escalar los procedimientos a todas las secciones censales de España. Solo tendremos que tener en cuenta la carga computacional, algo sobre lo que daremos algunas pinceladas y nos permitirá introducir la computación paralela en una única máquina con varios procesadores.

5.1 SIOSE 2014

SIOSE es una base de datos de ocupación del suelo orientada a objetos y relativamente compleja de manipular, cada polígono tiene un descriptor que debe guardar determinadas reglas a partir de un conjunto de coberturas simples.

Su estructura está descrita con detalle en la información técnica de SIOSE (Equipo Técnico Nacional SIOSE 2015, 2018a, 2018b). Goerlich y Cantarino (2012, 2013) y Reig, Goerlich y Cantarino (2016) describen con detalle la estructura de las primeras versiones de SIOSE y muestran su utilización en diferentes contextos.

Afortunadamente todos los polígonos de SIOSE2014 tiene una doble clasificación jerárquica que deriva de las recomendaciones de Inspire sobre la cubierta terrestreAnexo II, tema 2, Land Cover– y los usos del sueloAnexo III, tema 4, Land Use–. Son estas clasificaciones las que se ofrecen en el visor iberpix del IGN.

Para el caso de las coberturas del suelo el campo se denomina CODIIGE y contempla la clasificación en 46 coberturas, a 3 niveles, que se ofrecen en la Tabla 2 de Goerlich (2023a) o en el Anexo II de la documentación técnica que acompaña la descarga de datos. Todo lo que nos interesa saber aquí es que las 3 primeras coberturas hacen referencia a coberturas urbanas de tipo residencial: Casco (111), Ensanche (112) y Discontinuo (113). Son estas coberturas las que nos ayudarán a encontrar el punto representativo de la población dentro de la sección censal.

Para el caso de los usos del suelo el campo se denomina HILUCS y contempla la clasificación en 16 usos, a 3 niveles, que se ofrecen en la Tabla 3 de Goerlich (2023a) o en el Anexo II de la documentación técnica que acompaña la descarga de datos. Todo lo que nos interesa saber aquí es que uno de los usos es precisamente residencial (500).

Cada polígono tiene asignado un código de cobertura CODIIGE y un código de uso HILUCS, de forma que debemos decantarnos por utilizar un tipo u otro de información. Utilizaremos la información sobre coberturas –más adelante veremos porque–.

Algoritmo –tentativo– para generar un punto representativo de la población de cada sección censal


  1. Seleccionar las coberturas representativas de residencia de la población –Casco (111), Ensanche (112) y Discontinuo (113)– y disolverlas –crear una capa única–.

  2. Intersectar geométricamente –st_intersection– la capa anterior con las secciones censales. Para cada sección censal tendremos un registro –simple feature– con los polígonos donde hay población residente.

  3. Calcular el centroide del polígono más grande –st_centroid(of_largest_polygon = TRUE)– de la intersección anterior.

Implementemos este algoritmo para Requena (46213).

  1. Las coberturas de CODIIGE de Casco (111), Ensanche (112) y Discontinuo (113), una vez disueltas, se muestran en el mapa 9.
Mapa 9 - Coberturas urbanas de SIOSE 2014: Casco, Ensanche y Discontinuo - Requena

Esto muestra los polígonos urbanos y, en consecuencia, el centroide de cada sección censal representativo de la población deberá caer dentro de alguno de esos polígonos.

  1. La intersección geométrica de estos polígonos de SIOSE2014 y las secciones censales se muestra en el mapa 10.
Mapa 10 - Coberturas urbanas de SIOSE 2014 y secciones censales - Requena

Observa que dentro de cada sección censal tenemos, en muchos casos, varios polígonos –la simple feature geometry es MULTIPOLYGON–, pero solo hay un registro por sección censal. Es una estructura de datos conveniente, porque estamos interesados en un punto por sección censal, ¡pero ya veremos que no es la única posible!

  1. Calculamos el centroide del polígono más grande de la intersección anterior. Estos centroides se muestran en el mapa 11.
Mapa 11 - Coberturas urbanas y centroides SIOSE 2014 por sección censal - Requena

¿Son razonables estos centroides como puntos representativos de donde localizar la población de cada sección censal? Si.

Para darse cuenta solo hace falta compararlos con los centroides geométricos de las secciones censales que aparecen en el mapa 8. ¡Puedes comparar ambos centroides en el mapa 12!

Mapa 12 - Centroides geométricos de las secciones censales versus centroides de SIOSE 2014 - Requena

Observa las diferencias y notables mejoras en algunas secciones censales, por ejemplo, la 4621301003, que tiene una parte en el núcleo urbano de Requena, o la más grande, 4621304001, en el sur del término municipal, que tiene varios núcleos de población, y localizamos ahora la población en el mayor de ellos, Los Isidros (46213002301), en lugar de en medio de la nada, 👍.

En muchos casos esta es una solución relativamente sencilla, fácil de implementar y suficientemente precisa para los cálculos que queremos.

¿Es la solución ideal o perfecta? No.

Por una parte, hay secciones censales que tienen varios núcleos, y el procedimiento anterior selecciona el polígono residencial de uno de ellos –¡el más grande desde el punto de vista de su superficie!– para localizar la población. ¡Estas son las reglas del juego! Queremos un punto representativo de la población por sección censal. Sería posible arreglar esto, pero requeriría información adicional –quizá combinar la información de las secciones censales con las del nomenclátor– o criterios de reparto de la población de una sección censal entre sus diferentes núcleos de población, con lo que acabaríamos con casos en los que tendríamos más de un punto de población por sección censal. Estos procedimientos son dificiles de generalizar y complicados de automatizar para grandes áreas, pero examina el ejercicio de Goerlich y Cantarino (2012) si te interesan estos juegos. No extenderemos esta vía aquí. ¡Seguimos queriendo un punto de población por sección censal! En cada aplicación concreta debemos tener en cuenta el trade-off entre el esfuerzo dedicado a afinar la información y los beneficios derivados de la misma.

Por otra parte, no hay ninguna garantía de que el centroide de un polígono caiga en el interior de dicho polígono. ¡Podría parecer raro, pero no lo es!

De hecho esto pasa en dos secciones censales.

Tabla 8 - Secciones Censales cuyo centroide cae fuera del polígono residencial - Requena
Municipio
Código Nombre Sección Censal Población Superficie (km²)
46213 Requena 4621302003 1,782 3.972
46213 Requena 4621302006 1,863 0.272
Fuente: Estadística del Padrón Continuo (INE)


¡Puedes verlo en el mapa 11! Ambas secciones censales están en el núcleo principal de Requena (46213).

En muchos casos esto no es limitativo, estos puntos pueden ser perfectamente representativos a efectos de los cálculos en los que estamos interesados, pero desde luego no es estético. Piensa que ni siquiera hay garantía de que el centroide caiga dentro de la sección censal, ¡buscamos procedimientos relativamente automáticos!

¿Podemos forzar que los puntos representativos de la población caigan dentro de los polígonos de interés? Si, siempre podemos calcular un punto dentro de un polígono, –st_point_on_surface()–, aunque no se corresponda con el centroide geométrico del mismo.

Para las secciones censales en las que el centroide no cae dentro del polígono el mapa 13 muestra estos puntos junto con los anteriores.

Mapa 13 - Coberturas urbanas de SIOSE 2014 y puntos de población por sección censal - Requena

¿Arreglado? No, examina la sección censal 4621302003.

¿Cual es el problema? st_point_on_surface() no tiene la opción of_largest_polygon, 👎, y en consecuencia el punto elegido puede caer en un polígono residencial minúsculo, poco representativo de donde se localiza la mayor parte de la población dentro de la sección censal. Eso es lo que sucede con la sección censal 4621302003.

¿Podemos arreglar eso? Si, pero requiere algo de trabajo.

Ya hemos observado que la intersección de SIOSE2014 con las secciones censales genera simple features –los registros de cada sección censal– cuya geometría es –o puede ser– MULTIPOLYGON, es decir, está compuesta por varios polígonos.13 Lo que hay que hacer es extraer todos los polígonos de cada simple feature, st_cast("POLYGON"),14 seleccionar el mayor para cada sección censal15 y calcular el punto representativo de la población para ese polígono –st_point_on_surface()–. ¡Como la selección del mayor polígono no es automática debemos hacerla nosotros!

Modificamos ahora nuestro algoritmo tentativo, ¡y lo convertimos en definitivo!

Algoritmo para generar un punto representativo de la población de cada sección censal


  1. Seleccionar las coberturas representativas de residencia de la población –Casco (111), Ensanche (112) y Discontinuo (113)– y disolverlas –crear una capa única–.

  2. Intersectar geométricamente –st_intersection– la capa anterior con las secciones censales. Para cada sección censal tendremos un registro –simple feature– con los polígonos donde hay población residente.

  3. Calcular el centroide del polígono más grande –st_centroid(of_largest_polygon = TRUE)– de la intersección anterior.

  4. ¿Caen todos los centroides del paso anterior dentro de los polígonos de la intersección del paso 2?

  5. Dos alternativas:

    • Si la respuesta a la pregunta anterior es si, ¡hemos acabado, 👍!

    • Si la respuesta a la pregunta anterior es no, y queremos que los puntos representativos de la población caigan dentro de los polígonos de interés, deberemos hacer algo más de trabajo.

  6. Para los centroides que no caen dentro del polígono de interés:

    • Seleccionar el polígono más grande de la intersección del paso 2.

    • Calcular un punto dentro de dicho polígono –st_point_on_surface()–.

El resultado de aplicar el algoritmo anterior se muestra en el mapa 14. Ahora todos los puntos representativos de la población caen en el interior del mayor polígono de interés de cada sección censal.

Mapa 14 - Puntos de población por sección censal: SIOSE2014 - Requena

¡Eureka, hemos solucionado nuestro problema, 👍!

Desde el punto de vista práctico los pasos 3 a 6 del algoritmo anterior deberían ser implementados paso a paso. Pero, ¡estás de suerte!, están programados en una función específica st_centroid_within_poly(). No se trata de una función de sf, ¡sino de una función propia que encontrarás en el project de R que acompaña a estas notas!16

Dicha función implementa exactamente los pasos 3 a 6 del algoritmo anterior a partir de la layer obtenida en el paso 2. Es decir, toma como input una capa poligonal, quizá con geometría MULTIPOLYGON, con un registro por sección censal –u otra área administrativa– y devuelve como output una capa puntual con un registro por sección censal –u otra área administrativa– en la que el punto es el centroide del mayor polígono de cada simple feature si dicho punto cae dentro del polígono, o un punto dentro de dicho polígono si el centroide cae fuera del mismo. Además, la función añade una variable, type, que indica el origen del punto, centroid o point_on_surface, lo que permite mantener un registro del origen de la coordenada.

En el caso de Requena (46213) el resultado de aplicar st_centroid_within_poly() se muestra en la tabla 9, con las coordenadas en WGS84, listas para enviar a un servicio de routing.

Tabla 9 - Puntos representativos de la población por sección censal (SIOSE2014) - Requena
Municipio
Coordenadas (WGS84)
Código Nombre Sección Censal Población Superficie (km²) Tipo Longitud Latitud
46213 Requena 4621301001 2,128 15.111 centroid -1.097854 39.48563
46213 Requena 4621301002 2,486 105.758 centroid -1.080668 39.48697
46213 Requena 4621301003 1,211 75.092 centroid -1.096204 39.49234
46213 Requena 4621302002 1,303 0.152 centroid -1.102010 39.48651
46213 Requena 4621302003 1,782 3.972 point_on_surface -1.105812 39.48711
46213 Requena 4621302004 1,679 0.070 centroid -1.102110 39.48878
46213 Requena 4621302005 1,322 0.805 centroid -1.104065 39.48512
46213 Requena 4621302006 1,863 0.272 point_on_surface -1.110064 39.48984
46213 Requena 4621302007 2,158 0.433 centroid -1.101877 39.49066
46213 Requena 4621303001 1,786 45.741 centroid -1.152915 39.51976
46213 Requena 4621303002 910 54.593 centroid -1.123321 39.47591
46213 Requena 4621303003 666 128.845 centroid -1.168142 39.43150
46213 Requena 4621304001 764 383.400 centroid -1.292529 39.41913
Fuente: Estadística del Padrón Continuo (INE), SIOSE 2014 (IGN) y elaboración propia.


5.2 IGR Poblaciones

IGR Poblaciones es un conjunto de datos espaciales diseñado para proporcionar la localización geográfica y la forma geométrica de las entidades y áreas de población.

En el contexto de esta información, las entidades y áreas de población se denominan genéricamente poblaciones, que son agrupaciones de uno o más edificios y sus espacios asociados que son conocidos por una misma denominación; incluyendo los de uso residencial, las infraestructuras sociales y zonas industriales. ¡Por tanto, poblaciones aquí son agrupaciones de edificaciones! Tiene cobertura nacional, se distribuye por CCAA en formato Geopackage, y actualmente la versión más reciente es la 2020.1, que en el momento de escribir estas notas –marzo 2023– todavía no cubre la totalidad del territorio nacional. Ha sufrido varios cambios y mejoras desde que comenzó a producirse (2018), y no se descarta que sufra modificaciones en el futuro.

Aunque no se presenta de esta forma, podemos pensar en la IGR-PO como una versión espacial poligonal, en formato vectorial, del Nomenclátor de Población del INE. Naturalmente dicho nomenclátor, por razones históricas y de gestión administrativa, no está pensado para su representación geométrica sobre plano y en consecuencia su encaje sobre el terreno esté lleno de dificultades prácticas.

Desde el punto de vista mecánico ya sabemos lo que debemos hacer para conseguir un punto representativo de la población dentro de cada sección censal, de forma que la única diferencia entre usar SIOSE o la IGR-PO es la información de partida que nos permite acotar donde reside la población dentro de la sección censal. ¡El algoritmo de ejecución es idéntico! Nos centraremos, pues, en la información que, para estos propósitos, encontramos en la IGR-PO.

El modelo de datos de IGR-PO permite obtener un producto adaptado a las necesidades concretas de una aplicación a partir de sus 3 tablas fundamentales de producción:

  1. catalogo_a: Registro alfanumérico del conjunto de datos de Poblaciones.

  2. areapoblacion_s: Geometrías superficiales que representan usos poblacionales predominantes con asociación común a una o varias poblaciones.

  3. catareapob_a: Tabla alfanumérica que relaciona cada geometría de la tabla areapoblacion_s con uno o varios registros de la tabla catalogo_a.

Además de estas tablas básicas de producción, la IGR-PO distribuye dos productos derivados que nos pueden simplificar la vida en este caso, especialmente el segundo:

  1. envolvente_s: poblaciones que no están contenidas en otras y geométricamente definidas por todos los usos poblacionales.

  2. núcleo_s: poblaciones identificadas como núcleos en el Nomenclátor de Población del INE y geométricamente definidas excluyendo los usos no edificado y golf.

La capa núcleo_s, MULTIPOLYGON, dispone de código INE del nomenclátor, de forma que esta parece la información ideal para el ejercicio que estamos buscando, ya que está formada por los edificios que son identificados como núcleos en el Nomenclátor de Población del INE. Para Requena (46231) dicha capa ofrece información para 29 núcleos, que coinciden exactamente con los que encontramos en el nomenclátor del INE en 2022 –incluyendo el núcleo de Los Sardineros (46213001402) que carece de población, pero dispone de 22 edificios según IGR-PO–.

Una vez seleccionada la información auxiliar que nos va a permitir acotar la población residente dentro de cada sección censal aplicamos el algoritmo anterior para determinar el punto representativo de la población dentro de la misma. Naturalmente el punto concreto será diferente, porque la información auxiliar lo es, pero no debería haber grandes diferencias. Esta información se ofrece en el mapa 15, que puede ser comparado con el mapa 14.

Mapa 15 - Puntos de población por sección censal: IGR-Poblaciones - Requena

Los resultados numéricos representados en el mapa 15 pueden verse en la tabla 10, que muestra las diferencias respecto a las coordenadas obtenidas a partir de SIOSE2014 –tabla 9–.

Tabla 10 - Puntos representativos de la población por sección censal (IGR-PO) - Requena
Municipio
Coordenadas (WGS84)
Código Nombre Sección Censal Población Superficie (km²) Tipo Longitud Latitud
46213 Requena 4621301001 2,128 15.111 centroid -1.094639 39.48465
46213 Requena 4621301002 2,486 105.758 point_on_surface -1.090416 39.48813
46213 Requena 4621301003 1,211 75.092 centroid -1.096726 39.49208
46213 Requena 4621302002 1,303 0.152 centroid -1.102008 39.48649
46213 Requena 4621302003 1,782 3.972 centroid -1.108137 39.48662
46213 Requena 4621302004 1,679 0.070 centroid -1.102110 39.48878
46213 Requena 4621302005 1,322 0.805 centroid -1.104264 39.48477
46213 Requena 4621302006 1,863 0.272 centroid -1.108974 39.49068
46213 Requena 4621302007 2,158 0.433 centroid -1.101843 39.49066
46213 Requena 4621303001 1,786 45.741 centroid -1.152062 39.51980
46213 Requena 4621303002 910 54.593 centroid -1.123146 39.47513
46213 Requena 4621303003 666 128.845 centroid -1.167462 39.43149
46213 Requena 4621304001 764 383.400 centroid -1.292782 39.42028
Fuente: Estadística del Padrón Continuo (INE), IGR-PO (IGN) y elaboración propia.

Ahora, la aplicación de st_centroid_within_poly() solo genera un centroide fuera del polígono de edificaciones de IGR-PO, que además no coincide con ninguno de los dos casos anteriores –tabla 9–. La razón se debe a que los polígonos residenciales son diferentes en ambas capas.

Las diferencias son pequeñas y, al nivel que estamos trabajando –sección censal–, los cálculos deben ser equivalentes con cualquiera de las coordenadas estimadas. No obstante el mapa 16 muestra, a efectos de comparación, las coordenadas derivadas de SIOSE2014 y de IGR-PO versión 2020.1. ¡En algunos casos son prácticamente idénticas, en otros hay pequeñas diferencias!

Mapa 16 - Puntos de población por sección censal: SIOSE2014 versus IGR-Poblaciones

6. Escalado: Comunitat Valenciana

Ya hemos visto que, independientemente de que utilicemos la información de SIOSE o de IGR Poblaciones, los procedimientos son básicamente los mismos.

Escalamos ahora el problema de encontrar un punto representativo de la población de cada sección censal para todos los municipios de la Comunitat Valenciana (CVA) a partir de la información de SIOSE2014, utilizando las coberturas CODIIGE de Casco (111), Ensanche (112) y Discontinuo (113).17

La primera pregunta que surge es, ¿porque CODIIGE y no HILUCS? Al fin y al cabo HILUCS tiene un uso específicamente residencial (500). La respuesta la tienes en el script 01Wally.R del project de R que acompaña a estas notas.18 Si hubiéramos utilizado el uso residencial de HILUCS (500) hubiéramos perdido por el camino 2 secciones censales.

Una en Jijona/Xixona (03083), se trata de un polígono con cobertura mayoritaria de uso educativo, que no es etiquetado como residencial por SIOSE2014 en la clasificación jerárquica HILUCS, ¡a pesar de que pueda existir población residente!

Otra en Fuentes de Ayódar (12064), claramente por un error de asignación del uso en HILUCS. ¡Este es, además, un municipio con sección censal única!

Observación 8:

1. Las bases de datos jerárquicas de coberturas/usos realizan una asignación mediante coberturas/usos mayoritarios, y siempre pierden algo de detalle que puede ser importante en un caso concreto.

2. Las bases de datos geográficas, como todas, tienen errores, ¡aunque ahora podemos verlos dada la tecnología actual!, lo que no sucede con los errores de medición del PIB.

La moraleja es que es importante monitorizar los elementos que entran y salen del proceso. Si nuestro objeto son las secciones censales debemos tener las mismas al final del proceso que al principio.

En la CVA tenemos 3 484 secciones censales y 542 municipios en 2022. El objetivo es buscar –¡y encontrar!– 3 484 puntos representativos de donde situar la población en cada una de estas secciones censales.

Si ejecutamos nuestro algoritmo tentativo y buscamos el centroide del polígono de mayor tamaño después de intersectar con la capa urbana de SIOSE2014 encontraremos 221 casos, solo el 6.3%, en los que las coordenadas caen fuera del polígono SIOSE. Esto se muestra en el script 02Wally.R. ¡Hay un mapa!, de forma que puedes mirar toda la CVA. Examina los municipios de Ibi (03079) o Mutxamel (03090) para ver alguno de estos puntos, en Alicante (03014) podrás encontrar incluso algún caso en el que el centroide no cae ni siquiera dentro de la sección censal correspondiente.

Dos comentarios son de interés:

  1. Aunque nuestro problema no es, todavía, demasiado grande, la operaciones geográficas son muy intensivas en cálculo. En particular, la intersección geométrica –st_intersection– es tremendamente intensiva en computación y las mejoras en tiempo de ejecución son notables si podemos partir el problema en trozos.19 El script 02Wally.R ejecuta la intersección municipio a municipio, después de poner las secciones censales de cada municipio en una lista, group_split(), lo que nos permite utilizar una librería de programación funcional muy eficiente en R, purrr.

  2. Una vez tenemos dividido el problema en trozos resulta tremendamente sencillo de paralelizar. Encontrarás esta solución el final del script 02Wally.R. En secuencial el tiempo de ejecución del proceso es aproximadamente de 2.6 minutos, mientras que paralelizando con 6 núcleos, el tiempo de ejecución se reduce a 1 minuto, 👍. ¡Una ganancia no despreciable!, y que se incrementaría con el tamaño del problema. Volveremos sobre este punto al final del apartado.

Si queremos que todos los puntos representativos de la población caigan dentro del polígono residencial más grande de la sección censal correspondiente entonces debemos coger estos 221 casos, extraer de ellos el polígono de mayor tamaño y aplicarles la función st_point_on_surface(). Debemos, por tanto, implementar el algoritmo anterior. Esto está resuelto, step by step, en el script 03Wally.R. ¡Vuelve a haber mapa!, de forma que puedes mirar los casos anteriores, y ver como los puntos que caían fuera ahora caen dentro.

¡Los cálculos empiezan a ser algo engorrosos! ¿Podemos simplificarlos? Si.

¿No habíamos dicho, al introducir las secciones censales, que el 70% de los municipios tienen una sola sección censal? En la CVA tenemos 326 municipios con una sola sección censal, ello representa solo el 9.4% de la secciones censales, pero el 60% de los municipios.

¿No tenemos coordenadas para los municipios procedentes del IGN? Si.

Pues para estos casos no es necesario efectuar ningún cálculo, simplemente cogemos las coordenadas representativas del municipio. Esto ahorra tiempo de cálculo y proporciona consistencia en los resultados. ¡Para los municipios con una sección censal el punto donde situamos su población es el mismo si partimos de los municipio o si partimos de las secciones censales. El procedimiento completo, step by step en el que al final del proceso se sustituyen las coordenadas calculadas por las de los municipios, está resuelto en el script 04Wally.R. Este script no hace, sin embargo, los cálculos en el orden correcto, ya que las coordenadas de los municipios se sustituyen al final.

A partir de los scripts 03Wally.R y 04Wally.R puede verse la estructura del problema y como podemos simplificar su solución. Primero debemos extraer los municipios que solo tienen una sección censal y asignarles la coordenada representativa de su municipio. Luego implementamos en algoritmo anterior con la función propia para el resto de municipios:

  1. Hacemos la intersección de las secciones censales y SIOSE2014.

  2. Utilizamos la función st_centroid_within_poly(), que calcula el centroide del mayor polígono y si no cae dentro lo sustituye por uno que si caiga.

  3. Finalmente junta los dos grupos de municipios.

Este proceso está implementado de forma limpia y compacta en el script 05Wally.R, ¡que naturalmente genera los mismos resultados que el script 04Wally.R!

El proceso completo tarda 2.5 minutos en ejecutarse, de los que 1.8 corresponden a los cálculos. Los resultados se guardan en un fichero Excel, 05Wally.xlsx, y también en un fichero geográfico en formato Geopackage, 05Wally.gpkg.

6.1 Imprimiendo velocidad a los cálculos: Paralelizando en una sola máquina (Windows)

La aproximación utilizada para resolver el problema –dividirlo en trozos más pequeños, poner esos trozos en una lista, utilizar purrr para la operación más intensiva en computación, recoger los resultados y construir funciones propias sencillas para evitar operaciones repetitivas– facilita enormemente la paralelización de los cálculos, y con ello ventajas en tiempo de cómputo cuando el problema es muy grande.

Al final del script 02Wally.R se muestra como es posible paralelizar los cálculos que se hacen al principio del script.

Básicamente necesitas una librería de paralelización, future en nuestro caso, y, si eras capaz de poner el problema en un formato que sea resoluble por purrr, no hay más que sustituir la función usada de esa librería por la función correspondiente de la versión paralelizada de la misma, furrr, es decir, sustituir purrr::map() por furrr::future_map(). Naturalmente, hay que indicar el plan(), multissesion para una sola máquina, y cuantos cores o workers vas a utilizar, 6 en nuestro ejemplo, dado que el ordenador tiene 8 cores en total.

library(future)
library(furrr)
plan(strategy = multisession, workers = 6)

La versión paralelizada de 05Wally.gpkg es el script 05Wally_prll.R. El proceso completo tarda 1.6 minutos en ejecutarse, de los que 0.9 corresponden a los cálculos. ¡Una ganancia considerable en procesos mucho más largos! Los resultados se guardan en un fichero Excel, 05Wally_prll.xlsx, y también en un fichero geográfico en formato Geopackage, 05Wally_prll.gpkg.

Naturalmente los resultados de 05Wally.R y 05Wally_prll.R son idénticos.20

7. Conclusiones

Estas notas muestran la filosofía general sobre como acotar en el espacio una variable de interés a partir de información auxiliar de forma sencilla. En nuestro ejemplo, la población residente de las secciones censales a partir de información sobre coberturas/usos del suelo o edificaciones.

El problema es más general, aparece en la literatura bajo la denominación genérica de dasymetric mapping y admite numerosas variantes en función de problema concreto. Las técnicas mostradas son sencillas e incluyen solo operaciones GIS elementales, pero pueden complicarse sustancialmente e incorporar modelización estadística en los procesos de downscaling.



Referencias




  1. Goerlich y Pérez (2021) mantienen una librería histórica de contornos administrativos a partir de la Base de Datos de Líneas Límite del Instituto Geográfico Nacional (IGN) que es apropiada para análisis en Sistemas de Información Geográfica (GIS). Hernangómez (2023) mantiene una librería más general apropiada para representación gráfica y análisis menos detallado.↩︎

  2. El Nomenclátor Geográfico de Municipios y Entidades de Población del IGN dispone de coordenadas del municipio y de la capital del municipio que coinciden en la práctica totalidad de los casos, aunque difieren en unos pocos. En el caso de Requena (46213) dichas coordenadas coinciden, y se corresponden con las del núcleo de Requena (46213003101) de la Entidad Singular del mismo nombre (46213003100).↩︎

  3. En el momento de escribir estas notas –marzo 2023– se está a la espera de que el INE haga pública la grid del censo 2021.↩︎

  4. El problema es similar a combinar información raster, siempre pixelada, con vectorial y, como en este caso, la solución siempre implica un cierto grado de aproximación (Goerlich 2022a).↩︎

  5. Véase el apéndice A.1 de Reig, Goerlich y Cantarino (2016) sobre la dificultad de implementar esta aproximación a partir de la grid censal 2011 y los municipios españoles, dadas las inconsistencias encontradas en la grid generada por el INE a partir del Censo 2011.↩︎

  6. A pesar de ello, de acuerdo con la metodología del Nomenclátor Geográfico de Municipios y Entidades de Población del IGN: “Las coordenadas asignadas a todas las unidades poblacionales (municipios o entidades de población) han sido dadas a centroides (centroide: punto que se encuentra lo más centrado posible en el núcleo poblacional).” Lo que no se explica es de donde salen los polígonos que determinan estos centroides, ni el significado de ellos en el caso del diseminado.↩︎

  7. Además, mirando el mapa con detalle da la impresión de que la coordenada del diseminado de Penén de Albosa (46213001499), que era diferentes de la de su Entidad Singular (46213001400) y la de su núcleo (46213001401), es incorrecta, y debería haberse hecho coincidir con esta última.↩︎

  8. Puede verse Goerlich (2022b) para una aplicación de esta técnica a la generación de polígonos de Códigos Postales a partir de direcciones postales geo-referenciadas, ajustando dichos polígonos a los contornos de cada municipio.↩︎

  9. Desgraciadamente no siempre existe una correspondencia perfecta entre la información alphanumérica de las secciones censales procedente de Padrón y las secciones censales de los ficheros geográficos que distribuye el INE. En 2022 hay 10 secciones censales en la geografía que no existen en la estadística de Padrón. Afortunadamente ninguna de estas discrepancias corresponde a la Comunidad Valenciana. En 2021 la discrepancia es solo de 1 sección censal.↩︎

  10. En terminología del INE: “La aproximación postal está definida como la dirección postal hasta portal.” Y constituye el atributo básico que que define el territorio en el marco estadístico del INE.↩︎

  11. La necesidad surge, en este caso concreto, de la intención de realizar cálculos de accesibilidad (Goerlich, Maudos y Mollá 2021) de la población a las oficinas bancarias, fundamentalmente en un contexto urbano, donde la grid de 1km \(\times\) 1km ofrece poca resolución, pero sin olvidar el mundo rural. ¡Naturalmente el problema es mucho más general!↩︎

  12. En el momento de escribir estas notas –marzo 2023– esta es la última fecha para la que está disponible SIOSE completo para el conjunto nacional, estando parcialmente disponible SIOSE de Alta Resolución (SIOSE-AR) para 2017. SIOSE-AR supone, además de un aumento considerable en la resolución, un cambio en la estructura de la información disponible.↩︎

  13. Por ello calculábamos el centroide para el polígono mayor –st_centroid(of_largest_polygon = TRUE)–.↩︎

  14. Lo que generará un capa layer que tendrá tantos registros como polígonos –¡no como secciones censales!–. ¿Que sucede con los atributos de la secciones censales? Que se replican para cada polígono de la sección censal. Esto es lo que quiere decir cuando veas:

    Warning message:

    st_... assumes attributes are constant over geometries

    ↩︎
  15. Para lo que tendrás que calcular su área –st_area()–.↩︎

  16. Esta función utiliza una función auxiliar que selecciona el mayor polígono de una layer MULTIPOLIGON, y que puede ser de utilidad de forma independiente, st_largest_polygon(). Ambas funciones están en la carpeta fn del project de R.↩︎

  17. Podríamos escalarlo a todas las secciones censales de España para 2022, pero ya hemos observado que existe, para dicho año, una discrepancia entre las secciones censales que aparecen en la geografía y en la explotación estadística de Padrón, por lo que preferimos ceñirnos al caso de la CVA. Los procedimientos serían idénticos, si bien, cuanto más grande es el tamaño del problema más probabilidad hay de que surjan desajustes. ¡El tamaño importa, y en ocasiones mucho!

    En cualquier caso, estos desajustes deberán ser resueltos con anterioridad a acometer el proceso de búsqueda del punto representativo de la población dentro de cada sección censal.↩︎

  18. Los scripts del project de R que acompaña a estas notas tienen carácter fundamentalmente didáctico. El problema de interés puede –y debe– resolverse en un solo script construido de forma interactiva, pero diversos scripts muestran diferentes pasos en la construcción de la solución final, y almacenan resultados intermedios. Si solo te interesa el final de proceso puedes consultar el script 05Wally.R o su versión paralelizada, 05Wally_prll.R, que comentaremos al final de este apartado.↩︎

  19. Técnicamente esto no es así exactamente en nuestro problema porque la capa CODIIGE de SIOSE2014 contiene solamente una fila después de su disolución –es una simple feature–, pero es así habitualmente en casos más generales. El mensaje aquí es doble.

    (i) En cálculos geográficos vale la pena pensar en tiempos de ejecución y optimizar –en la medida de lo posible– el código, ya que los tiempos pueden ser extremadamente largos.

    (ii) La forma en la que se dividen los cálculos en el script 02Wally.R hace extremadamente sencillo introducir la computación distribuida en una sola máquina, tal y como se muestra al final del script.↩︎

  20. Y también idénticos a los generados en el script 04Wally.R.↩︎