Tasa de Paro de los Municipios de Valencia para el mes de Septiembre del 2023
Input
En el cátalogo de datos de esta web se encuentran los datos estadísticos del SEPE sobre Paro Registrado, desgregados por municipio, sexo, edad y sector de actividad económica, publicados por el Servicio Público de Empleo Estatal (Ministerio de Trabajo y Economía Social). Desde este enlace, es posible descargar los datos desde el año 2006 hasta el año 2024, pudiendo seleccionar únicamente el primer o segundo semestre del año deseado.
En esta ocasión, se desea realizar un estudio sobre la tasa de paro de los municipios de la provincia de Valencia para analizar si existe autocorrelación espacial. Por lo tanto, se descargan los datos del año 2023 y se procede a mejorar y modificar el conjunto de datos según las necesidades, extrayendo los municipios de la provincia de valencia y la variable de interés (Paro Registrado total) para el mes de septiembre de 2023.
Descripción
Se cargan las librerías necesarias:
Se lee el conjunto de datos:
datos <- read_xlsx("data/datosProyectoFinal_ParoMunicipios.xlsx")
New names:
• `` -> `...1`
• `` -> `...2`
• `` -> `...3`
• `` -> `...4`
• `` -> `...6`
• `` -> `...7`
• `` -> `...8`
• `` -> `...9`
• `` -> `...10`
• `` -> `...11`
• `` -> `...12`
• `` -> `...13`
• `` -> `...14`
• `` -> `...15`
• `` -> `...16`
• `` -> `...17`
• `` -> `...18`
• `` -> `...19`
• `` -> `...20`
dim(datos)
[1] 97609 20
En un primer lugar, el conjunto de datos consta de 97609 observaciones y 20 variables, al recopilar información de todos los municipios de España. Por ello, se aplicará un filtrado para seleccionar únicamente las observaciones y variables necesarias.
Trataminento
Se lee el conjunto de datos pero, esta vez, indicando que inicie en la primera columna (A) y la observación 71316, y que finalice en la última columna (T) y la observación 71581. De esta forma, se seleccionaran únicamente los municipios de Valencia con todas las variables correspondientes al mes de septiembre de 2023.
Además, se añaden los nombres correspondientes a las variables.
datos <- read_xlsx("data/datosProyectoFinal_ParoMunicipios.xlsx",
range = "A71316:T71581",
col_names = FALSE)
colnames(datos) <- c("cod_MES", "MES", "cod_CCAA", "CCAA", "cod_PROV", "PROV",
"cod_MUN", "MUN", "total_paro", "hombre<25", "hombre25-25",
"hombre>45", "mujer<25", "mujer25-45", "mujer>45",
"paro_agricultura", "paro_industria", "paro_construccion",
"paro_servicios", "paro_sinempleo")
A continuación, se seleccionan las variables de la 5 a la 9, que incluyen el código de la provincia de Valencia (cod_PROV), el nombre de la provincia de Valencia, tanto en castellano como en valencià (PROV), el código de los municipios (cod_MUN), los nombres de los municipios (MUN) y la variable de más interés, el total de Paro Registrado (total_paro).
Aunque este filtrado podría haberse realizado al cargar el conjunto de datos, se optó por mantener las demás variables para análisis futuros, por ejemplo, la tasa de Paro Registrado de las mujeres menores de 25 años, que sería la variable 11 del conjunto de datos original, se podría utilizar fácilmente para otro estudio sin tener que cargar la base de datos original.
totalParoVLC <- datos[, 5:9]
totalParoVLC$cod_MUN <- as.character(totalParoVLC$cod_MUN)
# se convierte la variable cod_MUN a caracter para evitar errores futuros al fusionar
Ya se ha obtenido el conjunto de datos mejorado. Sin embargo, la unidad de medida para el total de Paro Registrado es el número de habitantes del municipio. No tendría sentido comparar el paro de esta forma, ya que aquellos municipios con más habitantes tendrían más paro sí o sí. Por ello, se descargará un conjunto de datos con el número de habitantes de cada municipio de la provincia de Valencia y se fusionará con esta base de datos (totalParoVLC).
El conjunto de datos se ha obtenido desde este enlace https://www.ine.es/jaxiT3/Tabla.htm?t=2903&L=0 que pertenece al Instituto Nacional de Estadística (INE).
En primer lugar, se lee el conjunto de datos indicando que inicie en la primera columna (A) y la observación 9, y finalice en la segunda columna (B) y la observación 275.
poblacion <- read_xlsx("data/poblacionMunicipios.xlsx",
range = "A9:B275",
col_names = FALSE)
En segundo lugar, se añaden los nombres de las variables correspondientes, municipios y POB para el nombre de los municipios y la población, respectivamente.
En tercer lugar, se separa el código del municipio (cod_MUN) y el nombre del municipio (MUN) como dos variables diferentes, ordenando los códigos municipales de menor a mayor.
En cuarto lugar, se elimina la primera observación, que es repetida, obteniendo así 266 variables, al igual que en el conjunto de datos totalParoVLC.
En quinto lugar, se fusionan los dos conjuntos de datos por la variable cod_MUN. Luego, se convierten las variables total_paro y POB a tipo numérico para poder operar con ellas y crear la variable tasaParo, expresada en porcentaje (%) para permitir comparaciones adecuadas.
Por otro lado, se decide convertir a cero el total de Paro Registrado en municipios con menos de 5 habitantes, ya que el símbolo “<” causaba la pérdida de algunos valores y la generación de valores NA.
dt <- full_join(poblacion, totalParoVLC, by=c("cod_MUN"))
dt$total_paro <- ifelse(dt$total_paro == "<5", 0, datos$total_paro)
dt$total_paro <- as.numeric(dt$total_paro)
dt$POB <- as.numeric(dt$POB)
dt <- dt %>% mutate(tasaPARO = total_paro/(POB/100))
En último lugar, se obtiene la cartografía de los municipios de la provincia de Valencia con el paquete mapSpain, la función esp_get_munic(), y filtrando por el código de municipio (cpro) correspondiente a Valencia (46).
A continuación, se fusiona la cartografía con la base de datos anterior para obtener un conjunto de datos que incluya la tasa de paro de todos los municipios de la provincia de Valencia con su cartografía.
munVLC <- mapSpain::esp_get_munic() %>% filter(cpro == 46)
valencia <- left_join(munVLC, dt, by=c("LAU_CODE"="cod_MUN"))
Output
Se ha obtenido un objeto sf, con 266 observaciones y 15 variables:
class(valencia)
[1] "sf" "data.frame"
dim(valencia)
[1] 266 15
En el siguiente gráfico se muestra un mapa de la provincia de Valencia donde están representados todos los municipios, coloreados según su tasa de paro para el mes de septiembre de 2023.
sf::st_write(valencia, "valenciaTasaParo.gpkg")
El fichero generado con el procedimiento descrito anteriormente se puede descargar, en formato GeoPackage (gpkg), de aquí.
Proyecto de Innovación Educativa Emergente (PIEE-2737007)