Mejora de dataset espacial: Distritos de Valencia

datos espaciales
Valencia
open data
análisis geoespacial
Autor/a
Afiliación

Lucía Torrijos González

Universidad de Valencia (UV)

Fecha de publicación

1 de abril de 2026

Input

Se ha obtenido un conjunto de datos espacial correspondiente a los distritos administrativos de la ciudad de Valencia.

El dataset original proviene del portal de datos abiertos del Ayuntamiento de Valencia y contiene la delimitación geográfica de los distritos en formato GeoJSON.

Fuente del dataset:

Portal de datos abiertos del Ayuntamiento de Valencia: https://valencia.opendatasoft.com

Dataset utilizado: https://valencia.opendatasoft.com/explore/dataset/districtes-distritos/table/

El fichero incluye información geográfica sobre los distritos, pero presenta algunos aspectos que pueden mejorarse para facilitar su utilización en análisis espaciales con R.

El dataset original se encuentra en formato GeoJSON y contiene geometrías de tipo polígono.

Descripción

Tras revisar el dataset original se detectan algunos aspectos que pueden mejorarse:

  • Algunos nombres de columnas no siguen una convención homogénea.
  • Existen variables que no son necesarias para análisis básicos.
  • No se incluyen variables derivadas que faciliten análisis posteriores.
  • El dataset puede optimizarse para su uso en R mediante el uso de objetos espaciales del tipo sf.

Por ello se propone realizar un proceso de limpieza, simplificación y mejora del conjunto de datos.

Las mejoras propuestas incluyen la estandarización de nombres de variables, la creación de un identificador único para cada distrito y la generación de un dataset derivado con los centroides geográficos, que facilita su uso en análisis estadísticos y visualizaciones cartográficas.

Tratamiento

Para mejorar el conjunto de datos se ha utilizado el lenguaje R junto con librerías especializadas en manipulación de datos y análisis espacial.

El proceso de tratamiento se ha estructurado en las siguientes fases:

  1. Descarga del dataset original desde la fuente oficial
  2. Lectura del objeto espacial
  3. Limpieza y estandarización de variables
  4. Creación de un identificador único
  5. Generación de centroides
  6. Exportación en formatos optimizados
# Primero se cargan las librerías necesarias.
library(sf)
library(dplyr)
library(stringr)
library(leaflet)
# Descargar dataset desde la fuente oficial
url <- "https://valencia.opendatasoft.com/explore/dataset/districtes-distritos/download/?format=geojson&timezone=Europe/Madrid"

temp <- tempfile(fileext = ".geojson")
download.file(url, temp, mode = "wb")
distritos <- st_read(temp, quiet=T)
st_crs(distritos) #el sistema de referencia espacial corresponde a WGS84 (EPSG:4326)
Coordinate Reference System:
  User input: WGS 84 
  wkt:
GEOGCRS["WGS 84",
    DATUM["World Geodetic System 1984",
        ELLIPSOID["WGS 84",6378137,298.257223563,
            LENGTHUNIT["metre",1]]],
    PRIMEM["Greenwich",0,
        ANGLEUNIT["degree",0.0174532925199433]],
    CS[ellipsoidal,2],
        AXIS["geodetic latitude (Lat)",north,
            ORDER[1],
            ANGLEUNIT["degree",0.0174532925199433]],
        AXIS["geodetic longitude (Lon)",east,
            ORDER[2],
            ANGLEUNIT["degree",0.0174532925199433]],
    ID["EPSG",4326]]
# Visualizar su estructura
str(distritos)
Classes 'sf' and 'data.frame':  22 obs. of  7 variables:
 $ nombre                : chr  "ALGIROS" "POBLATS MARITIMS" "POBLATS DEL NORD" "POBLATS DEL NORD" ...
 $ coddistrit            : chr  "13" "11" "17" "17" ...
 $ gis_gis_distritos_area: num  NA NA NA NA NA ...
 $ geo_point_2d          : chr  "{ \"lon\": -0.3427809202640324, \"lat\": 39.477634097819504 }" "{ \"lon\": -0.32635890797773354, \"lat\": 39.452005207411709 }" "{ \"lon\": -0.39202139553517285, \"lat\": 39.522294860628421 }" "{ \"lon\": -0.35945821125735933, \"lat\": 39.524680485565128 }" ...
 $ latitud               : chr  "39.477634097819504" "39.45200520741171" "39.52229486062842" "39.52468048556513" ...
 $ longitud              : chr  "-0.3427809202640324" "-0.32635890797773354" "-0.39202139553517285" "-0.35945821125735933" ...
 $ geometry              :sfc_POLYGON of length 22; first list element: List of 1
  ..$ : num [1:132, 1:2] -0.343 -0.343 -0.342 -0.342 -0.342 ...
  ..- attr(*, "class")= chr [1:3] "XY" "POLYGON" "sfg"
 - attr(*, "sf_column")= chr "geometry"
 - attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA
  ..- attr(*, "names")= chr [1:6] "nombre" "coddistrit" "gis_gis_distritos_area" "geo_point_2d" ...
# Limpieza y reordenacion de variables
distritos_limpio <- distritos %>%
  select(nombre = nombre)

distritos_limpio <- distritos_limpio %>%
  mutate(
    nombre = str_to_title(nombre)  )

distritos_limpio <- distritos_limpio %>%
  mutate(
    id_distrito = row_number()  )

distritos_limpio <- distritos_limpio %>%
  select(id_distrito, nombre, geometry)

plot(st_geometry(distritos_limpio)) # Visualizacion del dataset

# Exportamos el dataset mejorado
st_write(
  distritos_limpio,
  "output/distritos_valencia_mejorado.gpkg",
  delete_dsn = TRUE)
centroides <- st_centroid(distritos_limpio)

centroides_coords <- cbind(
  st_drop_geometry(centroides),
  st_coordinates(centroides))
write.csv(
  centroides_coords,
  "output/distritos_valencia_centroides.csv",
  row.names = FALSE)
#grafico
leaflet(distritos_limpio) %>%
  addProviderTiles("CartoDB.Positron") %>%
  addPolygons(
    popup = ~nombre,
    fillOpacity = 0.5,
    color = "blue",
    weight = 1
  )

Output

Tras el proceso de limpieza, estandarización y mejora del dataset original, se han generado dos nuevos ficheros listos para su reutilización en análisis geoespacial:

1. distritos_valencia_mejorado.gpkg

Contiene la delimitación geográfica de los distritos de Valencia en formato GeoPackage (.gpkg). Este formato es ampliamente utilizado en Sistemas de Información Geográfica (SIG) por su eficiencia, portabilidad y capacidad para almacenar geometrías junto con atributos en un único archivo.

El dataset incluye: - Identificador único por distrito (id_distrito) - Nombre del distrito normalizado - Geometría de tipo polígono

2. distritos_valencia_centroides.csv

Archivo en formato CSV que contiene los centroides de cada distrito junto con sus coordenadas geográficas (X, Y). Este fichero facilita su uso en: - Análisis estadísticos - Modelización - Visualización en mapas interactivos

Sistema de referencia de coordenadas (CRS):
WGS84 – EPSG:4326

Este sistema es el estándar más utilizado en aplicaciones web y herramientas GIS, lo que garantiza la interoperabilidad del dataset.

Los ficheros generados se encuentran disponibles aquí.



Proyecto de Innovación Educativa Emergente (PIEE-3898312)