Mejora de dataset espacial: Distritos de Valencia
Input
Se ha obtenido un conjunto de datos espacial correspondiente a los distritos administrativos de la ciudad de Valencia.
El dataset original proviene del portal de datos abiertos del Ayuntamiento de Valencia y contiene la delimitación geográfica de los distritos en formato GeoJSON.
Fuente del dataset:
Portal de datos abiertos del Ayuntamiento de Valencia: https://valencia.opendatasoft.com
Dataset utilizado: https://valencia.opendatasoft.com/explore/dataset/districtes-distritos/table/
El fichero incluye información geográfica sobre los distritos, pero presenta algunos aspectos que pueden mejorarse para facilitar su utilización en análisis espaciales con R.
El dataset original se encuentra en formato GeoJSON y contiene geometrías de tipo polígono.
Descripción
Tras revisar el dataset original se detectan algunos aspectos que pueden mejorarse:
- Algunos nombres de columnas no siguen una convención homogénea.
- Existen variables que no son necesarias para análisis básicos.
- No se incluyen variables derivadas que faciliten análisis posteriores.
- El dataset puede optimizarse para su uso en R mediante el uso de objetos espaciales del tipo
sf.
Por ello se propone realizar un proceso de limpieza, simplificación y mejora del conjunto de datos.
Las mejoras propuestas incluyen la estandarización de nombres de variables, la creación de un identificador único para cada distrito y la generación de un dataset derivado con los centroides geográficos, que facilita su uso en análisis estadísticos y visualizaciones cartográficas.
Tratamiento
Para mejorar el conjunto de datos se ha utilizado el lenguaje R junto con librerías especializadas en manipulación de datos y análisis espacial.
El proceso de tratamiento se ha estructurado en las siguientes fases:
- Descarga del dataset original desde la fuente oficial
- Lectura del objeto espacial
- Limpieza y estandarización de variables
- Creación de un identificador único
- Generación de centroides
- Exportación en formatos optimizados
# Descargar dataset desde la fuente oficial
url <- "https://valencia.opendatasoft.com/explore/dataset/districtes-distritos/download/?format=geojson&timezone=Europe/Madrid"
temp <- tempfile(fileext = ".geojson")
download.file(url, temp, mode = "wb")
distritos <- st_read(temp, quiet=T)st_crs(distritos) #el sistema de referencia espacial corresponde a WGS84 (EPSG:4326)Coordinate Reference System:
User input: WGS 84
wkt:
GEOGCRS["WGS 84",
DATUM["World Geodetic System 1984",
ELLIPSOID["WGS 84",6378137,298.257223563,
LENGTHUNIT["metre",1]]],
PRIMEM["Greenwich",0,
ANGLEUNIT["degree",0.0174532925199433]],
CS[ellipsoidal,2],
AXIS["geodetic latitude (Lat)",north,
ORDER[1],
ANGLEUNIT["degree",0.0174532925199433]],
AXIS["geodetic longitude (Lon)",east,
ORDER[2],
ANGLEUNIT["degree",0.0174532925199433]],
ID["EPSG",4326]]
# Visualizar su estructura
str(distritos)Classes 'sf' and 'data.frame': 22 obs. of 7 variables:
$ nombre : chr "ALGIROS" "POBLATS MARITIMS" "POBLATS DEL NORD" "POBLATS DEL NORD" ...
$ coddistrit : chr "13" "11" "17" "17" ...
$ gis_gis_distritos_area: num NA NA NA NA NA ...
$ geo_point_2d : chr "{ \"lon\": -0.3427809202640324, \"lat\": 39.477634097819504 }" "{ \"lon\": -0.32635890797773354, \"lat\": 39.452005207411709 }" "{ \"lon\": -0.39202139553517285, \"lat\": 39.522294860628421 }" "{ \"lon\": -0.35945821125735933, \"lat\": 39.524680485565128 }" ...
$ latitud : chr "39.477634097819504" "39.45200520741171" "39.52229486062842" "39.52468048556513" ...
$ longitud : chr "-0.3427809202640324" "-0.32635890797773354" "-0.39202139553517285" "-0.35945821125735933" ...
$ geometry :sfc_POLYGON of length 22; first list element: List of 1
..$ : num [1:132, 1:2] -0.343 -0.343 -0.342 -0.342 -0.342 ...
..- attr(*, "class")= chr [1:3] "XY" "POLYGON" "sfg"
- attr(*, "sf_column")= chr "geometry"
- attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA
..- attr(*, "names")= chr [1:6] "nombre" "coddistrit" "gis_gis_distritos_area" "geo_point_2d" ...
# Limpieza y reordenacion de variables
distritos_limpio <- distritos %>%
select(nombre = nombre)
distritos_limpio <- distritos_limpio %>%
mutate(
nombre = str_to_title(nombre) )
distritos_limpio <- distritos_limpio %>%
mutate(
id_distrito = row_number() )
distritos_limpio <- distritos_limpio %>%
select(id_distrito, nombre, geometry)
plot(st_geometry(distritos_limpio)) # Visualizacion del dataset# Exportamos el dataset mejorado
st_write(
distritos_limpio,
"output/distritos_valencia_mejorado.gpkg",
delete_dsn = TRUE)centroides <- st_centroid(distritos_limpio)
centroides_coords <- cbind(
st_drop_geometry(centroides),
st_coordinates(centroides))write.csv(
centroides_coords,
"output/distritos_valencia_centroides.csv",
row.names = FALSE)#grafico
leaflet(distritos_limpio) %>%
addProviderTiles("CartoDB.Positron") %>%
addPolygons(
popup = ~nombre,
fillOpacity = 0.5,
color = "blue",
weight = 1
)Output
Tras el proceso de limpieza, estandarización y mejora del dataset original, se han generado dos nuevos ficheros listos para su reutilización en análisis geoespacial:
1. distritos_valencia_mejorado.gpkg
Contiene la delimitación geográfica de los distritos de Valencia en formato GeoPackage (.gpkg). Este formato es ampliamente utilizado en Sistemas de Información Geográfica (SIG) por su eficiencia, portabilidad y capacidad para almacenar geometrías junto con atributos en un único archivo.
El dataset incluye: - Identificador único por distrito (id_distrito) - Nombre del distrito normalizado - Geometría de tipo polígono
2. distritos_valencia_centroides.csv
Archivo en formato CSV que contiene los centroides de cada distrito junto con sus coordenadas geográficas (X, Y). Este fichero facilita su uso en: - Análisis estadísticos - Modelización - Visualización en mapas interactivos
Sistema de referencia de coordenadas (CRS):
WGS84 – EPSG:4326
Este sistema es el estándar más utilizado en aplicaciones web y herramientas GIS, lo que garantiza la interoperabilidad del dataset.
Los ficheros generados se encuentran disponibles aquí.

Proyecto de Innovación Educativa Emergente (PIEE-3898312)
