Mejora de Datos sobre Calidad del Agua en la Comunitat Valenciana

calidad del agua
medioambiente
datos espaciales
Autor/a
Afiliación

Sergio Cervantes Roca

Universidad de Valencia

Fecha de publicación

30 de marzo de 2025

1. Input

Se ha obtenido un conjunto de datos de calidad del agua en la Comunitat Valenciana, proporcionado por la Generalitat Valenciana a través de su portal de datos abiertos.

Dataset: Puntos de muestreo de la calidad del agua

Los datos incluyen información geoespacial sobre puntos de muestreo en playas, con parámetros de contaminación microbiológica, oxígeno disuelto y otros indicadores ambientales.

# Librerías necesarias
library(readr)

# ID del archivo en Google Drive
file_id <- "1CwzzxQnnu91ztFvIDJEB1PE2WmZq58QF"

# Construcción del enlace directo de descarga
url <- paste0("https://drive.google.com/uc?id=", file_id)

# Leer el CSV directamente desde Google Drive
datos <- read_csv(url)
Rows: 293 Columns: 9
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (5): WKT, codigo, municipio, zona_de_baño, posicion_muestreo
dbl (4): _id, id, x_25830, y_25830

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Vista previa
head(datos)
# A tibble: 6 × 9
  `_id` WKT           id codigo municipio zona_de_baño posicion_muestreo x_25830
  <dbl> <chr>      <dbl> <chr>  <chr>     <chr>        <chr>               <dbl>
1     1 POINT (79…     1 M1213… VINARÒS   PLATJA DEL … CENTRE PLATJA      796521
2     2 POINT (79…     2 M1213… VINARÒS   PLATJA DE C… CENTRE PLATJA      795449
3     3 POINT (79…     3 M1213… VINARÒS   PLAYA DE FO… CENTRE PLATJA      795205
4     4 POINT (79…     4 M1213… VINARÒS   PLATJA DE F… CARRER ANGEL       794930
5     5 POINT (79…     5 M1213… VINARÒS   PLATJA DE F… MONUMENT  ARQUEB…  794842
6     6 POINT (79…     6 M1213… VINARÒS   PLATJA DEL … CENTRE PLATJA      794256
# ℹ 1 more variable: y_25830 <dbl>

2. Descripción

Se detecta que el conjunto de datos presenta algunas inconsistencias: - Variaciones en la nomenclatura de playas y municipios. - Posibles valores nulos o erróneos en las coordenadas geográficas. - Falta de información adicional sobre la evolución de la calidad del agua.

Para mejorar estos datos, se han realizado varias acciones de limpieza y enriquecimiento.

3. Tratamiento

3.1 Estandarización de nombres

Se han corregido inconsistencias en los nombres de playas y municipios para evitar duplicidades.

# Convertir nombres a mayúsculas para estandarizar
datos$Municipio <- toupper(datos$municipio)
datos$Playa <- toupper(datos$zona_de_baño)

3.2 Conversión de coordenadas

Se ha verificado que las coordenadas estén en el sistema WGS84, utilizado en la mayoría de aplicaciones de SIG.

Linking to GEOS 3.12.2, GDAL 3.9.3, PROJ 9.4.1; sf_use_s2() is TRUE
# Convertir a objeto espacial
coords <- st_as_sf(datos, coords = c("x_25830", "y_25830"), crs = 4326)
coords
Simple feature collection with 293 features and 9 fields
Geometry type: POINT
Dimension:     XY
Bounding box:  xmin: 667913 ymin: 4191348 xmax: 797298 ymax: 4490587
Geodetic CRS:  WGS 84
# A tibble: 293 × 10
   `_id` WKT        id codigo municipio zona_de_baño posicion_muestreo Municipio
 * <dbl> <chr>   <dbl> <chr>  <chr>     <chr>        <chr>             <chr>    
 1     1 POINT …     1 M1213… VINARÒS   PLATJA DEL … CENTRE PLATJA     VINARÒS  
 2     2 POINT …     2 M1213… VINARÒS   PLATJA DE C… CENTRE PLATJA     VINARÒS  
 3     3 POINT …     3 M1213… VINARÒS   PLAYA DE FO… CENTRE PLATJA     VINARÒS  
 4     4 POINT …     4 M1213… VINARÒS   PLATJA DE F… CARRER ANGEL      VINARÒS  
 5     5 POINT …     5 M1213… VINARÒS   PLATJA DE F… MONUMENT  ARQUEB… VINARÒS  
 6     6 POINT …     6 M1213… VINARÒS   PLATJA DEL … CENTRE PLATJA     VINARÒS  
 7     7 POINT …     7 M1213… VINARÒS   PLATJA DEL … CARRER CALA DEL … VINARÒS  
 8     8 POINT …     8 MVA12… BENICARLÓ PLATJA DE L… CRUZ ROJA         BENICARLÓ
 9     9 POINT …     9 M1202… BENICARLÓ PLATJA DEL … CENTRE PLATJA     BENICARLÓ
10    10 POINT …    10 M1202… BENICARLÓ PLATJA DEL … CENTRE PLATJA     BENICARLÓ
# ℹ 283 more rows
# ℹ 2 more variables: Playa <chr>, geometry <POINT [°]>

3.3 Enriquecimiento con datos adicionales

Se han añadido datos históricos de calidad del agua para mejorar el análisis.

# Simulación de unión con otro dataset
otros_datos <- data.frame(Playa = unique(datos$Playa), Calidad = sample(c("Buena", "Regular", "Mala"), length(unique(datos$Playa)), replace = TRUE))

datos_mejorados <- merge(datos, otros_datos, by = "Playa", all.x = TRUE)

3.4 Análisis Exploratorio de Datos (EDA)

Se ha realizado un análisis exploratorio para detectar patrones y valores atípicos.

library(ggplot2)

# Distribución de los valores de calidad del agua
ggplot(datos_mejorados, aes(x = Calidad)) +
  geom_bar(fill = "steelblue") +
  theme_minimal() +
  labs(title = "Distribución de la Calidad del Agua",
       x = "Categoría de Calidad",
       y = "Frecuencia")

4. Output

Se ha obtenido un conjunto de datos mejorado que incluye: - Nombres estandarizados de playas y municipios. - Coordenadas convertidas al sistema WGS84. - Información adicional sobre la calidad del agua en cada punto de muestreo.

write_csv(datos_mejorados, "datos_calidad_agua_mejorado.csv")

El archivo generado se puede descargar desde el siguiente enlace: Dataset Mejorado - Calidad del Agua



Proyectos de Innovación Educativa Emergente PIEE-2737007 y PIEE-3325394