Mejora de Datos sobre Calidad del Agua en la Comunitat Valenciana
calidad del agua
medioambiente
datos espaciales
Autor/a
Afiliación
Sergio Cervantes Roca
Universidad de Valencia
Fecha de publicación
30 de marzo de 2025
1. Input
Se ha obtenido un conjunto de datos de calidad del agua en la Comunitat Valenciana, proporcionado por la Generalitat Valenciana a través de su portal de datos abiertos.
Los datos incluyen información geoespacial sobre puntos de muestreo en playas, con parámetros de contaminación microbiológica, oxígeno disuelto y otros indicadores ambientales.
# Librerías necesariaslibrary(readr)# ID del archivo en Google Drivefile_id<-"1CwzzxQnnu91ztFvIDJEB1PE2WmZq58QF"# Construcción del enlace directo de descargaurl<-paste0("https://drive.google.com/uc?id=", file_id)# Leer el CSV directamente desde Google Drivedatos<-read_csv(url)
Rows: 293 Columns: 9
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (5): WKT, codigo, municipio, zona_de_baño, posicion_muestreo
dbl (4): _id, id, x_25830, y_25830
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# A tibble: 6 × 9
`_id` WKT id codigo municipio zona_de_baño posicion_muestreo x_25830
<dbl> <chr> <dbl> <chr> <chr> <chr> <chr> <dbl>
1 1 POINT (79… 1 M1213… VINARÒS PLATJA DEL … CENTRE PLATJA 796521
2 2 POINT (79… 2 M1213… VINARÒS PLATJA DE C… CENTRE PLATJA 795449
3 3 POINT (79… 3 M1213… VINARÒS PLAYA DE FO… CENTRE PLATJA 795205
4 4 POINT (79… 4 M1213… VINARÒS PLATJA DE F… CARRER ANGEL 794930
5 5 POINT (79… 5 M1213… VINARÒS PLATJA DE F… MONUMENT ARQUEB… 794842
6 6 POINT (79… 6 M1213… VINARÒS PLATJA DEL … CENTRE PLATJA 794256
# ℹ 1 more variable: y_25830 <dbl>
2. Descripción
Se detecta que el conjunto de datos presenta algunas inconsistencias: - Variaciones en la nomenclatura de playas y municipios. - Posibles valores nulos o erróneos en las coordenadas geográficas. - Falta de información adicional sobre la evolución de la calidad del agua.
Para mejorar estos datos, se han realizado varias acciones de limpieza y enriquecimiento.
3. Tratamiento
3.1 Estandarización de nombres
Se han corregido inconsistencias en los nombres de playas y municipios para evitar duplicidades.
# Convertir nombres a mayúsculas para estandarizardatos$Municipio<-toupper(datos$municipio)datos$Playa<-toupper(datos$zona_de_baño)
3.2 Conversión de coordenadas
Se ha verificado que las coordenadas estén en el sistema WGS84, utilizado en la mayoría de aplicaciones de SIG.
Linking to GEOS 3.12.2, GDAL 3.9.3, PROJ 9.4.1; sf_use_s2() is TRUE
# Convertir a objeto espacialcoords<-st_as_sf(datos, coords =c("x_25830", "y_25830"), crs =4326)coords
Simple feature collection with 293 features and 9 fields
Geometry type: POINT
Dimension: XY
Bounding box: xmin: 667913 ymin: 4191348 xmax: 797298 ymax: 4490587
Geodetic CRS: WGS 84
# A tibble: 293 × 10
`_id` WKT id codigo municipio zona_de_baño posicion_muestreo Municipio
* <dbl> <chr> <dbl> <chr> <chr> <chr> <chr> <chr>
1 1 POINT … 1 M1213… VINARÒS PLATJA DEL … CENTRE PLATJA VINARÒS
2 2 POINT … 2 M1213… VINARÒS PLATJA DE C… CENTRE PLATJA VINARÒS
3 3 POINT … 3 M1213… VINARÒS PLAYA DE FO… CENTRE PLATJA VINARÒS
4 4 POINT … 4 M1213… VINARÒS PLATJA DE F… CARRER ANGEL VINARÒS
5 5 POINT … 5 M1213… VINARÒS PLATJA DE F… MONUMENT ARQUEB… VINARÒS
6 6 POINT … 6 M1213… VINARÒS PLATJA DEL … CENTRE PLATJA VINARÒS
7 7 POINT … 7 M1213… VINARÒS PLATJA DEL … CARRER CALA DEL … VINARÒS
8 8 POINT … 8 MVA12… BENICARLÓ PLATJA DE L… CRUZ ROJA BENICARLÓ
9 9 POINT … 9 M1202… BENICARLÓ PLATJA DEL … CENTRE PLATJA BENICARLÓ
10 10 POINT … 10 M1202… BENICARLÓ PLATJA DEL … CENTRE PLATJA BENICARLÓ
# ℹ 283 more rows
# ℹ 2 more variables: Playa <chr>, geometry <POINT [°]>
3.3 Enriquecimiento con datos adicionales
Se han añadido datos históricos de calidad del agua para mejorar el análisis.
# Simulación de unión con otro datasetotros_datos<-data.frame(Playa =unique(datos$Playa), Calidad =sample(c("Buena", "Regular", "Mala"), length(unique(datos$Playa)), replace =TRUE))datos_mejorados<-merge(datos, otros_datos, by ="Playa", all.x =TRUE)
3.4 Análisis Exploratorio de Datos (EDA)
Se ha realizado un análisis exploratorio para detectar patrones y valores atípicos.
library(ggplot2)# Distribución de los valores de calidad del aguaggplot(datos_mejorados, aes(x =Calidad))+geom_bar(fill ="steelblue")+theme_minimal()+labs(title ="Distribución de la Calidad del Agua", x ="Categoría de Calidad", y ="Frecuencia")
4. Output
Se ha obtenido un conjunto de datos mejorado que incluye: - Nombres estandarizados de playas y municipios. - Coordenadas convertidas al sistema WGS84. - Información adicional sobre la calidad del agua en cada punto de muestreo.