Tasa de Paro de los Municipios de Valencia para el mes de Septiembre del 2023

PARO
MUNICIPIO
VALENCIA
Autor/a
Afiliación

Sabina Pinilla Llácer

Universitat de València

Fecha de publicación

10 de mayo de 2024

Input

En el cátalogo de datos de esta web se encuentran los datos estadísticos del SEPE sobre Paro Registrado, desgregados por municipio, sexo, edad y sector de actividad económica, publicados por el Servicio Público de Empleo Estatal (Ministerio de Trabajo y Economía Social). Desde este enlace, es posible descargar los datos desde el año 2006 hasta el año 2024, pudiendo seleccionar únicamente el primer o segundo semestre del año deseado.

En esta ocasión, se desea realizar un estudio sobre la tasa de paro de los municipios de la provincia de Valencia para analizar si existe autocorrelación espacial. Por lo tanto, se descargan los datos del año 2023 y se procede a mejorar y modificar el conjunto de datos según las necesidades, extrayendo los municipios de la provincia de valencia y la variable de interés (Paro Registrado total) para el mes de septiembre de 2023.

Descripción

Se cargan las librerías necesarias:

Se lee el conjunto de datos:

datos <- read_xlsx("data/datosProyectoFinal_ParoMunicipios.xlsx")
New names:
• `` -> `...1`
• `` -> `...2`
• `` -> `...3`
• `` -> `...4`
• `` -> `...6`
• `` -> `...7`
• `` -> `...8`
• `` -> `...9`
• `` -> `...10`
• `` -> `...11`
• `` -> `...12`
• `` -> `...13`
• `` -> `...14`
• `` -> `...15`
• `` -> `...16`
• `` -> `...17`
• `` -> `...18`
• `` -> `...19`
• `` -> `...20`
dim(datos)
[1] 97609    20

En un primer lugar, el conjunto de datos consta de 97609 observaciones y 20 variables, al recopilar información de todos los municipios de España. Por ello, se aplicará un filtrado para seleccionar únicamente las observaciones y variables necesarias.

Trataminento

Se lee el conjunto de datos pero, esta vez, indicando que inicie en la primera columna (A) y la observación 71316, y que finalice en la última columna (T) y la observación 71581. De esta forma, se seleccionaran únicamente los municipios de Valencia con todas las variables correspondientes al mes de septiembre de 2023.

Además, se añaden los nombres correspondientes a las variables.

datos <- read_xlsx("data/datosProyectoFinal_ParoMunicipios.xlsx", 
                   range = "A71316:T71581", 
                   col_names = FALSE)

colnames(datos) <- c("cod_MES", "MES", "cod_CCAA", "CCAA", "cod_PROV", "PROV", 
                     "cod_MUN", "MUN", "total_paro", "hombre<25", "hombre25-25", 
                     "hombre>45", "mujer<25", "mujer25-45", "mujer>45", 
                     "paro_agricultura", "paro_industria", "paro_construccion", 
                     "paro_servicios", "paro_sinempleo")

A continuación, se seleccionan las variables de la 5 a la 9, que incluyen el código de la provincia de Valencia (cod_PROV), el nombre de la provincia de Valencia, tanto en castellano como en valencià (PROV), el código de los municipios (cod_MUN), los nombres de los municipios (MUN) y la variable de más interés, el total de Paro Registrado (total_paro).

Aunque este filtrado podría haberse realizado al cargar el conjunto de datos, se optó por mantener las demás variables para análisis futuros, por ejemplo, la tasa de Paro Registrado de las mujeres menores de 25 años, que sería la variable 11 del conjunto de datos original, se podría utilizar fácilmente para otro estudio sin tener que cargar la base de datos original.

totalParoVLC <- datos[, 5:9]
totalParoVLC$cod_MUN <- as.character(totalParoVLC$cod_MUN) 
  # se convierte la variable cod_MUN a caracter para evitar errores futuros al fusionar

Ya se ha obtenido el conjunto de datos mejorado. Sin embargo, la unidad de medida para el total de Paro Registrado es el número de habitantes del municipio. No tendría sentido comparar el paro de esta forma, ya que aquellos municipios con más habitantes tendrían más paro sí o sí. Por ello, se descargará un conjunto de datos con el número de habitantes de cada municipio de la provincia de Valencia y se fusionará con esta base de datos (totalParoVLC).

El conjunto de datos se ha obtenido desde este enlace https://www.ine.es/jaxiT3/Tabla.htm?t=2903&L=0 que pertenece al Instituto Nacional de Estadística (INE).

En primer lugar, se lee el conjunto de datos indicando que inicie en la primera columna (A) y la observación 9, y finalice en la segunda columna (B) y la observación 275.

poblacion <- read_xlsx("data/poblacionMunicipios.xlsx", 
                       range = "A9:B275", 
                       col_names = FALSE)

En segundo lugar, se añaden los nombres de las variables correspondientes, municipios y POB para el nombre de los municipios y la población, respectivamente.

colnames(poblacion) <- c("municipios", "POB")

En tercer lugar, se separa el código del municipio (cod_MUN) y el nombre del municipio (MUN) como dos variables diferentes, ordenando los códigos municipales de menor a mayor.

poblacion <- poblacion %>%
  tidyr::separate(municipios, into = c("cod_MUN", "MUN"), sep = " ", extra = "merge") %>%
  dplyr::arrange(cod_MUN)

En cuarto lugar, se elimina la primera observación, que es repetida, obteniendo así 266 variables, al igual que en el conjunto de datos totalParoVLC.

poblacion <- poblacion[2:267, 1:3]
nrow(poblacion) == nrow(totalParoVLC)
[1] TRUE

En quinto lugar, se fusionan los dos conjuntos de datos por la variable cod_MUN. Luego, se convierten las variables total_paro y POB a tipo numérico para poder operar con ellas y crear la variable tasaParo, expresada en porcentaje (%) para permitir comparaciones adecuadas.

Por otro lado, se decide convertir a cero el total de Paro Registrado en municipios con menos de 5 habitantes, ya que el símbolo “<” causaba la pérdida de algunos valores y la generación de valores NA.

dt <- full_join(poblacion, totalParoVLC, by=c("cod_MUN"))

dt$total_paro <- ifelse(dt$total_paro == "<5", 0, datos$total_paro)
dt$total_paro <- as.numeric(dt$total_paro)
dt$POB <- as.numeric(dt$POB)

dt <- dt %>% mutate(tasaPARO = total_paro/(POB/100))

En último lugar, se obtiene la cartografía de los municipios de la provincia de Valencia con el paquete mapSpain, la función esp_get_munic(), y filtrando por el código de municipio (cpro) correspondiente a Valencia (46).

A continuación, se fusiona la cartografía con la base de datos anterior para obtener un conjunto de datos que incluya la tasa de paro de todos los municipios de la provincia de Valencia con su cartografía.

munVLC <- mapSpain::esp_get_munic() %>% filter(cpro == 46)

valencia <- left_join(munVLC, dt, by=c("LAU_CODE"="cod_MUN"))

Output

Se ha obtenido un objeto sf, con 266 observaciones y 15 variables:

class(valencia)
[1] "sf"         "data.frame"
dim(valencia)
[1] 266  15

En el siguiente gráfico se muestra un mapa de la provincia de Valencia donde están representados todos los municipios, coloreados según su tasa de paro para el mes de septiembre de 2023.

valencia %>%
  tmap::tm_shape() +
  tmap::tm_polygons(col = "tasaPARO", border.col = "grey50",
                    style = "jenks", n=6,
                    palette = "Greens") +
  tmap::tm_layout(frame = F,
                  legend.position = c("left","bottom"),
                  inner.margins = rep(0,4))

sf::st_write(valencia, "valenciaTasaParo.gpkg")

El fichero generado con el procedimiento descrito anteriormente se puede descargar, en formato GeoPackage (gpkg), de aquí.



Proyecto de Innovación Educativa Emergente (PIEE-2737007)