Datos de Criminalidad en Municipios de Cádiz

CRIMINALIDAD
CÁDIZ
GPKG
Autor/a
Afiliación

Universitat de València

Fecha de publicación

10 de mayo de 2024

Input

Se han recopilado datos relativos al balance de criminalidad en los municipios de la provincia de Cádiz con una población superior a 20.000 habitantes. Estas estadísticas abarcan el año 2022 y provienen directamente del Ministerio del Interior. La información ha sido recabada por diversas entidades, entre las que se incluyen la Policía Nacional, la Guardia Civil, la Policía Autonómica de Cádiz y las Policías Locales, las cuales contribuyen con datos al Sistema Estadístico de Criminalidad.

Descripcion

Se identifica la necesidad de relacionar los datos de criminalidad con la información disponible en la librería mapSpain, la cual contiene la geometría geográfica de España. Este proceso es esencial para lograr una representación precisa de los resultados de criminalidad en un mapa geográfico.

Tratamiento

Para lograr mi objetivo, seguí los siguientes pasos:

  1. Descargué los datos de criminalidad de los municipios de Cádiz en formato Excel y los guardé como “Criminalidad_cadiz.xlsx”. Seleccioné las celdas desde A7 hasta B38 como datos, omitiendo los nombres de columna de Excel.

  2. Renombré las columnas del dataframe resultante como “Municipio” y “Casos”.

  3. Desplacé los valores de la columna “Casos” una fila hacia arriba.

  4. Eliminé las filas donde el municipio era “I. CRIMINALIDAD CONVENCIONAL”.

  5. Modifiqué los nombres de los municipios, eliminando prefijos y realizando correcciones en la nomenclatura para asegurar su coincidencia con los nombres de los municipios en la librería mapSpain. Por ejemplo, cambié “Barrios (Los)” por “Barrios, Los”, “Línea de la Concepción (La)” por “Línea de la Concepción, La” y “Puerto de Santa María (El)” por “Puerto de Santa María, El”.

  6. Posteriormente, obtuve un dataframe que contiene la geometría geográfica de los municipios de España, específicamente de la provincia de Cádiz.

  7. Finalmente, combiné los datos de criminalidad (en el dataframe crim22) con la información geográfica de los municipios de Cádiz (en el dataframe spain_mun) realizando un left_join de spain_mun.

library(dplyr)
library(mapSpain)
library(tmap)
library(sf)

crim22 <- readxl::read_xlsx("data/criminalidad_cadiz.xlsx", range = "A7:B38", col_names = F)
colnames(crim22) <- c("Municipio","Casos")

crim22 <- crim22 %>%
    mutate(Casos = lead(Casos)) %>% # Desplazar los valores de Casos una fila hacia arriba
    filter(Municipio != "I. CRIMINALIDAD CONVENCIONAL") %>% # Elimninamos estas filas
    mutate(Municipio = gsub("-Municipio de ", "", Municipio)) %>% # Dejamos solo el nombre del municipio
    mutate(Municipio = gsub("Barrios \\(Los\\)", "Barrios, Los", Municipio)) %>%
    mutate(Municipio = gsub("Línea de la Concepción \\(La\\)", "Línea de la Concepción, La", Municipio)) %>% 
    mutate(Municipio = gsub("Puerto de Santa María \\(El\\)", "Puerto de Santa María, El", Municipio))

# Municipios de Cádiz
spain_mun <- mapSpain::esp_get_munic(region = "Cádiz", epsg = "4258")

# Combinar los DataFrames en base a las columnas comunes, manteniendo todas las filas de "spain_mun"
crim22 <- left_join(spain_mun[, c('name', 'cmun', 'geometry')], crim22, by = c('name' = 'Municipio'))

head(crim22)
# Guardamos el archivo con extesión .gpkg
sf::st_write(crim22,"Cadiz_crim.gpkg", crs = 4258, delete_dsn = T, delete_layer = T)
# Representación en el mapa
crim22 %>%
  tm_shape() +
  tm_fill("Casos",
          style = "jenks", n = 6,
          palette = "Reds") +
  tm_borders(col = "black",alpha = 0.5) +
  tm_layout(frame = FALSE,
            legend.position = c("left", "bottom"),
            inner.margins = c(0, 0, 0, 0))

Output

El código utiliza la función st_write del paquete sf para guardar los datos contenidos en el objeto crim22 en un archivo geoespacial en formato GeoPackage con el nombre “Cadiz_crim.gpkg”. Esto se realiza con el propósito de almacenar la información de criminalidad de la provincia de Cádiz de manera estructurada y compatible con sistemas de información geográfica (SIG).

El sistema de coordenadas EPSG:4258 se especifica para asegurar la correcta referencia espacial de los datos en el archivo. Además, se utiliza la opción delete_dsn = TRUE para eliminar cualquier archivo preexistente con el mismo nombre antes de escribir el nuevo archivo, y delete_layer = TRUE para eliminar cualquier capa preexistente con el mismo nombre en el archivo, garantizando así la integridad y actualización de los datos.

El fichero generado, en formato GPKG, queda disponible para su descarga aquí.



Proyecto de Innovación Educativa Emergente (PIEE-2737007)