1 Introducción a los datos espaciales
En un mundo cada vez más interconectado, los datos espaciales han adquirido un papel fundamental como herramienta para comprender y organizar la realidad que nos rodea. Estos datos, que integran la dimensión espacial a la información tradicional, ofrecen un marco para analizar fenómenos en contextos geográficos y temporales, permitiendo una visión más completa y enriquecedora de los mismos.
Este primer tema, que tiene como objetivo principal sentar las bases del conocimiento sobre los datos espaciales, está estructurado en tres apartados: los tipos de datos espaciales, los Sistemas de Información Geográfica (SIG) y las fuentes y métodos de adquisición de datos espaciales. Cada uno de estos bloques proporciona un enfoque específico para entender cómo los datos espaciales son generados, gestionados y aplicados en diversos contextos.
El primer apartado está dedicado a conocer diferentes tipos de datos espaciales, que constituyen la esencia del análisis geoespacial. Se estudiarán dos categorías fundamentales: los datos vectoriales y los datos raster, analizando sus características principales, sus aplicaciones prácticas y las diferencias que los hacen idóneos para distintos propósitos. En el segundo bloque, se profundizará en los Sistemas de Información Geográfica, herramientas esenciales para el tratamiento de datos espaciales. Este bloque abordará cómo los SIG permiten gestionar, analizar y visualizar información geoespacial, facilitando la identificación de patrones, relaciones y tendencias. En el tercer apartado exploraremos diversas fuentes y métodos de adquisición de datos espaciales, aspecto fundamental para garantizar la calidad y precisión de la información utilizada.
1.1 Tipos de datos espaciales
En el epígrafe anterior, en el que tratábamos de abordar el concepto de SIG, hemos introducido los dos principales tipos de datos espaciales: vectoriales y raster. Ambos formatos tienen usos y características distintas, requieren tratamientos diferentes y, como veremos más adelante, deben de ser analizados de manera adecuada.
Por un lado, los datos vectoriales se caracterizan por su precisión en la representación de límites, líneas y puntos en un mapa. Estos datos son ideales para mapear ubicaciones específicas, como ciudades, carreteras o límites de parcelas, debido a su capacidad para capturar detalles finos y definir con precisión las formas. En el formato vectorial, el mundo se representa a través de puntos, líneas y polígonos, lo que permite una manipulación detallada y un análisis específico de elementos individuales. Este tipo de datos es particularmente útil en aplicaciones como la planificación urbana, donde la precisión de los límites y las ubicaciones es primordial.
Por otro lado, los datos raster se componen de una matriz de celdas en un espacio continuo, cada una con un valor específico que representa una característica del terreno, como la elevación o la temperatura. Este formato es extremadamente útil para analizar variaciones graduales y distribuciones espaciales, como los patrones climáticos o los mapas de elevación. Los datos raster son particularmente valiosos en el análisis de imágenes de satélite y en estudios ambientales, donde la representación de datos sobre un área extensa es más importante que la precisión de ubicaciones puntuales.
1.1.1 Formatos de datos
R es capaz de gestionar prácticamente todos los formatos de datos geoespaciales, tanto vectoriales (puntos, líneas y polígonos) como raster (datos en malla o rejilla). Como ya hemos visto en alguna sesión práctica, los datos geoespaciales incluyen información adicional almacenada en múltiples dimensiones (atributos). Durante el curso trabajaremos los formatos más comunes en el mundo de los Sistemas de Información Geográfica (SIG).
Hoy en día la disponibilidad de información de cualquier tipo es cada vez más sencilla y más accesible y, por tanto, disponemos de volúmenes de información tan grandes que hace unos pocos años hubiera sido imposible gestionar. En esta era del Big Data hemos necesitado adaptar los formatos de los archivos y crear otros nuevos para que sean capaces de almacenar de una manera eficiente cantidades enormes de información. El problema no solo reside en cómo comprimir toda esa información en un archivo de tamaño asumible, sino en que es más importante hasta qué punto es sencillo acceder a cada parte de la información que contiene. En este sentido, R ha evolucionado para facilitar el acceso a recursos muy potentes con los que gestionar toda la información, desde formatos de archivos propios (por ejemplo .rds
o .RData
) hasta la posibilidad del aprovechamiento de toda la capacidad de computación del hardware, lo cual hace aprovechable este lenguaje en supercomputadores.
No obstante lo anterior, para la mayoría del trabajo de análisis espacial no es necesario tener conocimientos avanzados de programación. De hecho, los paquetes de funciones más actuales ponen a disposición del usuario sencillas funciones que trabajan internamente a un nivel computacional muy intenso. La ventaja es que, para cualquier nivel de programación, los formatos de archivos son los mismos.
1.1.2 Tipo de datos vectorial
Shapefile: es el más utilizado con una gran diferencia. Todo software de análisis espacial que se precie debe poder leer/escribir este tipo de archivos. Se compone, como mínimo, de tres archivos: .shp (geometría de los datos), .shx (índices de los objetos que componen la capa) y .dbf (almacena la información de atributos de las entidades), aunque pueden acompañarlos varios más con información adicional (proyección, metadatos, etc.). En R las funciones de lectura leen el archivo .shp, que carga automáticamente el resto. Más info aquí.
geodatabase: es una colección de datasets geográficos de varios tipos contenida en una carpeta de sistema de archivos común o una base de datos relacional multiusuario.
CSV / GeoCSV: los clásicos archivos separados por comas (.csv) tienen una variación reciente que les otorga una opción adicional con información sobre su geometría, convirtiéndolos en archivos GeoCSV. La novedad es un campo denominado WKT, que almacena como una cadena de texto las coordenadas del punto al que corresponde cada línea (por ejemplo
POINT(-1.2353 35.8753)
). Al leer el archivo, este campo convierte automáticamente los datos en un objeto espacial.GPX: es un formato de intercambio muy común de información captada por un GPS. Representa los waypoints o tracks (rutas), entre otros.
KML / KMZ: formato por defecto de información espacial en Google Earth.
GML / XML: GML es la extensión de XML que permite la inclusión de coordenadas geográficas, guardándolas como cadenas de texto. Se puede usar cualquier editor de texto para modificar estos archivos.
GeoJSON: es el formato más común para la representación geográfica vía web. Guarda las coordenadas como texto en JavaScript Object Notation (JSON), pudiendo almacenar información puntual, lineal o de polígonos. Al estar basado en JavaScript, es muy popular para publicar geoinformación en internet a través de geoportales o servidores de mapas.
OpenStreetMap: la filosofía colaborativa de creación de información geográfica define a este tipo de archivos. Están basados en XML y su crecimiento y uso es imparable. Representan la información geográfica del futuro: colaborativa, de acceso abierto e interoperable.
1.1.3 Tipo de datos raster
GeoTiff: se trata del formato raster de referencia en interoperabilidad. Pueden acompañarle varios archivos complementarios etc. (.tfw, .aux o .xml) que aportan información sobre metadatos, geolocalización, proyección, etc. Es sin duda el formato más usado para información asociada a imágenes de satélite y productos derivados.
ASCII: aunque es de los formatos más antiguos, sigue usándose por su sencillez y escaso tamaño de archivos. Es, simplemente, texto plano con una cabecera que aporta la información espacial y la resolución. Lo puede leer cualquier SIG.
ECW: es un formato de archivo propietario que presenta unos ratios muy altos de compresión (hasta de 50:1). Como consecuencia de esto, se reduce considerablemente el tamaño de los archivos, manteniendo una alta calidad gráfica y permitiendo un rápida compresión y descompresión mediante un uso escaso de memoria RAM.
HDF (Hierarchical Data Format): diseñado para manejar grandes conjuntos de datos científicos, este formato es especialmente útil en el almacenamiento de datos satelitales y climáticos. Puede almacenar múltiples capas o bandas dentro de un solo archivo, lo que lo hace práctico para análisis multiespectrales. Es comúnmente utilizado en aplicaciones de teledetección y estudios medioambientales, aunque su manejo requiere herramientas específicas que soporten este formato.
1.1.4 Extensiones más comunes
La distinción que hacemos entre raster y vectorial también puede ser aplicable a otros formatos con los que estamos habituados a trabajar. Los archivos vectoriales, como PDF, SVG, EPS y AI, utilizan ecuaciones matemáticas para representar imágenes, permitiéndoles escalar a cualquier tamaño sin perder calidad. Esto los hace ideales para logotipos, ilustraciones detalladas y cualquier gráfico que requiera precisión y la capacidad de ser escalado sin comprometer la claridad. Por ejemplo, el formato PDF es ampliamente reconocido por su capacidad para contener tanto gráficos vectoriales como raster, preservando el formato original del documento, mientras que SVG y AI son preferidos para trabajos detallados en diseño web y gráfico, respectivamente.
Por otro lado, los formatos raster o de mapa de bits, como JPG, PNG, GIF y TIFF, están compuestos por píxeles, cada uno definido por colores específicos, lo que los hace perfectos para representar imágenes complejas como fotografías. Aunque estos formatos pueden perder calidad al ser ampliados debido a su naturaleza basada en píxeles, cada uno tiene sus propias ventajas en términos de compresión y uso específico. JPG es conocido por su compresión con pérdida que equilibra el tamaño del archivo con la calidad de imagen, haciéndolo ideal para fotografías digitales. PNG ofrece una compresión sin pérdida que conserva la calidad original de la imagen, perfecto para gráficos web que requieren transparencia, y TIFF se utiliza ampliamente en la fotografía profesional y la industria de la impresión por su alta calidad y flexibilidad.
1.2 Sistemas de Información Geográfica (SIG)
Durante siglos hemos utilizado los tradicionales mapas de papel para representar nuestro espacio y entorno y poder emprender acuerdos para gestionar, organizar y tomar decisiones sobre el territorio. Pero ¿qué ha sucedido en poco más de cuatro décadas? ¿Se continúan utilizando los mapas en papel de la misma manera?
Con la rápida evolución de los sistemas de información geográfica (SIG) y su tecnología asociada, los SIG han revolucionado el mundo de la cartografía, del análisis espacial, de la planificación y de la gestión del territorio.
Casi todas las cosas que suceden, suceden en alguna parte. A lo largo de los años los humanos hemos desarrollado nuestras actividades en la superficie del globo terrestre o cerca de ésta: construimos túneles; cavamos zanjas para sepultar las diferentes redes de tuberías y cables como el agua, el gas y la electricidad; construimos minas para explotar los minerales y perforamos el subsuelo para acceder a los pozos de petróleo y gas. Todas estas actividades son de gran importancia, igual que es de gran importancia saber dónde están ocurriendo.
Conocer dónde está sucediendo algo es de vital importancia si queremos ir allí o bien queremos enviar allí a alguien, e incluso si queremos encontrar alguna otra información sobre ese lugar o simplemente, por ejemplo, si queremos informar a la gente que vive alrededor. Por lo tanto, podemos afirmar que muchas decisiones** (o quizás todas) políticas, estratégicas y de planificación de acciones sobre el territorio tienen consecuencias geográficas.
Podemos decir, por tanto, que la información geográfica es información sobre un elemento en la superficie de la Tierra. Es el conocimiento sobre dónde hay algo y/o qué hay en un determinado lugar.
Con más detalle, la información geográfica:
- Es multidimensional: mediante dos coordenadas geográficas se puede definir cualquier posición en la superficie de la Tierra (X e Y o Latitud y Longitud).
- Depende de la resolución geográfica: puede ser muy detallada o muy genérica.
- Puede llegar a ser muy voluminosa.
- Se puede representar en diferentes formatos digitales, que pueden influir en los análisis y los resultados.
- Debe ser proyectada, a menudo, en una superficie plana.
- Requiere métodos especiales y un tiempo de dedicación en el análisis nada despreciable.
Una vez abordado el concepto de información geográfica (IG), es el momento de añadir el concepto de sistema, es decir, añadiremos la S del acrónimo SIG.
Un sistema de información es la unión de cierta información con las herramientas informáticas (hardware y software) que posibilitan su análisis, con unos objetivos concretos. Un sistema de información se usa para manipular, consultar, editar, visualizar… En definitiva, para trabajar con información almacenada en una base de datos.
Entre las múltiples definiciones de SIG nos podemos quedar con la formulada por Dueker y Kjerne (1989):
“Un sistema de información geográfica es un sistema de hardware, software, datos, personas, organizaciones y convenios institucionales para la recopilación, almacenamiento, análisis y distribución de información de territorios de la Tierra”.
1.2.1 ¿Qué problemas solucionan los SIG?
A continuación vamos a exponer algunos ejemplos en los que los SIG dan solución a problemas geográficos comunes y que se repiten periódicamente en el tiempo:
- Proporcionar información a las autoridades sanitarias para saber dónde deben construirse nuevos hospitales y clínicas en un territorio en concreto.
- Proporcionar información a las compañías de transporte y reparto que están interesadas en saber o descubrir nuevas rutas más cortas y/o económicas, o simplemente viables, para que se ajuste el programa de reparto diario.
- Proporcionar información a las autoridades de las infraestructuras viarias de un país para la nueva selección de rutas con el fin de construir autopistas o nuevas vías de comunicación en general.
- Proporcionar información a empresas que permita localizar el mejor punto geográfico para construir un negocio según el tipo de producto que comercializarán.
- Proporcionar información a los gobiernos para decidir dónde deben destinarse los fondos económicos para el desarrollo del país.
- Proporcionar información a los viajeros y turistas a la hora de seleccionar rutas, hoteles y puntos de interés de la zona.
- Proporcionar información a los agricultores para asesorarles en la toma de decisiones de, por ejemplo, cuántos fertilizantes y pesticidas se utilizarán y se aplicarán en las diferentes partes del campo de cultivo.
- Y un largo etcétera.
1.2.2 Tecnologías de la información geográfica
Hasta ahora hemos visto qué es la información geográfica, qué es un sistema de información y cómo se relacionan ambos conceptos para dar lugar a los sistemas de información geográfica. Al mismo tiempo también hemos visto algunas definiciones de SIG y sus aplicaciones en distintos ámbitos. Pero ¿qué hacemos para obtener y procesar toda esta información que necesitamos para llevar a cabo la resolución de un problema espacial?
La obtención de los datos e información y el posterior procesamiento no sería posible sin las Tecnologías de la Información Geográfica (TIG), también conocidas como geotecnologías. Algunos de los componentes principales de las TIG son:
- Sistemas globales de navegación por satélite (GNSS)
- Teledetección y sensores remotos
- Sistemas de información geográfica (SIG)
1.2.2.2 Teledetección y sensores remotos
Otras tecnologías para adquirir y procesar información geográfica son todas las relacionadas con la teledetección. La teledetección, o percepción remota, es la técnica que permite la obtención de imágenes de la superficie terrestre a partir del análisis manual o automático de los datos obtenidos desde plataformas como satélites o aviones. Las imágenes de satélite, fuente de datos para la teledetección, se toman mediante sensores.
Los sensores remotos están situados en los satélites que orbitan la Tierra y se utilizan para recopilar información de la superficie terrestre y de la atmósfera. Los sensores varían según el nivel de detalle que permiten visualizar y el rango del espectro electromagnético que detectan. Las señales se transmiten a estaciones receptoras en la superficie de la Tierra, donde se procesan y transforman en imágenes digitales para más tarde diseminarlas a los usuarios finales.
Los programas de teledetección más conocidos son Copernicus (programa europeo de observación de la Tierra, formado por la constelación Sentinel) y Landstat (programa estadounidense en el que cooperan la NASA y el Servicio Geológico de los Estados Unidos, USGS).
¿Qué usos podríamos dar a esta tecnología en el ámbito de la analítica de negocios?
Puedes profundizar más sobre este tema en la página web del Plan Nacional de Teledetección del Instituto Geográfico Nacional (IGN).
1.2.2.3 Sistemas de información geográfica (SIG)
Una vez visto lo que es un SIG, ¿cómo lo reconocemos? Vamos a responder a esta pregunta desde dos posiciones diferentes: desde el punto de vista de sistema y desde el punto de vista de software.
Desde el punto de vista de un sistema, los SIG permiten:
- Utilizar un tipo muy específico de equipos como son las grandes impresoras, los plotters, los scanners, las mesas digitalizadoras, etc.
- Almacenar mapas e imágenes.
- Incluir herramientas para procesar información y/o disponer de funciones especiales para trabajar con la información geográfica como visualizar en pantalla, editar, modificar, transformar, medir distancias y áreas, combinar mapas, etc.
- Disponer de funciones especializadas como mantener inventarios, gestionar propiedades o permitir evaluar la idoneidad de las actuaciones previstas en diferentes áreas.
- Producir nueva información mediante la fusión de información existente en diferentes formatos. Esta información generada puede ser de gran utilidad. Los mapas son sólo un método de representación de la información espacial, pero los SIG permiten ver la información espacial desde diferentes puntos de vista, que sirven de ayuda para la toma de decisiones.
Desde el punto de vista de software, reconocemos los SIG por las siguientes características:
- Es un tipo de software cuyas funciones son:
- Entrada de datos.
- Procesamiento de datos.
- Salida y representación de datos.
- Este software ha sido suministrado probablemente por una empresa desarrolladora de aplicaciones especializada en SIG.
- El precio de este tipo de software puede variar entre los 60 y los 60.000 euros. Actualmente hay diferentes proveedores de software SIG, algunos especializados en SIG y otros que ofrecen SIG como uno más de sus productos de mercado. También hay alternativas de SIG basadas en licencias de software libre.
Un SIG puede producir mapas profesionales de calidad gráfica excelente con una gran diversidad de símbolos, a diferentes escalas y proyecciones. Pero un SIG puede hacer mucho más que eso. En realidad, un SIG nunca presenta mapas de forma convencional, sino como una base de datos de coordenadas o como una colección de celdas (hablaremos de esto más adelante). A partir de esta base de datos podemos producir mapas en el momento que se requiera. Además de producir mapas y almacenarlos, un SIG también puede procesarlos, ya que los datos están almacenados en forma de modelo digital del mundo real, a diferencia de los mapas de papel convencionales.
1.2.3 Partes de un SIG
En los apartados anteriores nos hemos dedicado a la identificación de un sistema de información geográfica, pero sin entrar en detalle en las funciones, componentes y otros factores que interactúan. En este apartado profundizaremos en los datos geográficos y los tres componentes que los forman: el componente espacial, el temático y el temporal.
Los datos geográficos son la parte del SIG mediante la cual representamos la realidad y, a su vez, nos permiten enlazarla con situaciones y aplicaciones específicas. En realidad, los datos son una abstracción de la realidad, que almacenamos como códigos digitales en bases de datos. En este sentido, podemos considerar a los datos geográficos como valores, cadenas de caracteres o símbolos que proporcionan a quien los use información sobre la localización geográfica de entidades del mundo real. Es decir, dan respuestas a las preguntas qué, dónde y cuándo.
1.2.3.1 El componente espacial
Cuando hablamos del componente espacial, nos referimos a la localización geográfica, a las propiedades espaciales de los objetos y a las relaciones espaciales que hay entre éstos.
La localización geográfica hace referencia a la posición de los objetos sobre la superficie de la Tierra, utilizando, por ejemplo, coordenadas geográficas o direcciones postales. Además, dependiendo de sus dimensiones espaciales, los objetos pueden tener cierto tamaño: la longitud de una carretera, el área de un bosque o el volumen de una masa de agua. La localización de los objetos en el espacio se realiza mediante un sistema de coordenadas y varía según el tipo de datos presentado.
1.2.3.1.1 Datos de tipo vectorial
Los datos vectoriales representan características geográficas simpleas, como puntos, líneas y polígonos. Estos elementos se utilizan para representar ubicaciones precisas (como ciudades o pozos), caminos y ríos (líneas), o áreas como lagos, parcelas de terreno y otros polígonos.
Entre las características más distintivas de los datos vectoriales, se encuentran las siguientes:
- Ofrecen una representación muy precisa de las características de la Tierra.
- Cada entidad vectorial (punto, línea, polígono) puede contener datos atributivos en una base de datos, como nombres de ciudades, tipos de carreteras, o información demográfica.
- Son ámpliamente utilizados en cartografía para mapas detallados, planificación urbana, y SIG donde se requiere precisión, como en la gestión de redes de servicios públicos, propiedad de la tierra y planificación de infraestructuras.
1.2.3.1.2 Datos de tipo raster
En los datos de tipo raster, las entidades del mundo real se representan mediante una malla regular de celdas, donde cada celda contiene un valor. Los rasters son efectivos para representar datos que varían continuamente, como la elevación, la temperatura, o imágenes satelitales.
Entre las características más distintivas de los datos raster, se encuentran las siguientes:
- Son adecuados para representar variaciones graduales en el espacio.
- La resolución espacial viene definida por el tamaño de la celda, que determina el nivel de detalle de los datos.
- Son utilizados en teledetección, análisis de imágenes satelitales, modelado de elevaciones, mapas de uso del suelo, y en cualquier contexto donde los datos se extiendan de manera continua sobre áreas geográficas.
- En comparación con los datos vectoriales, los rasters son más sencillos y rápidos de procesar y son ideales para análisis y modelado complejos, como el análisis de superficie. Sin embargo, pueden carecer de la precisión geométrica de los datos vectoriales y pueden ocupar mucho espacio de almacenamiento, especialmente a altas resoluciones.
Si observamos la siguiente figura podemos establecer una comparativa visual entre ambos formatos:
Finalmente, el último aspecto que nos queda por explicar en relación con el componente espacial es el que también hemos introducido al principio de este apartado: las relaciones espaciales. En este punto incluimos relaciones espaciales como la proximidad (en el espacio o en el tiempo), la contigüidad, la conectividad, la inclusividad, etc. También se presentan entre diferentes objetos espaciales, pero no necesariamente deben almacenarse directamente en un SIG. Las hay que están explícitamente definidas en un SIG, otras se calculan cuando se requieren (o, sencillamente, no están disponibles). Podemos diferenciar dos tipos de relaciones espaciales:
- Las relaciones topológicas (de tipo cualitativo) son relaciones que responden, por ejemplo, a la contigüidad (si dos polígonos son limítrofes), a la inclusión (si un polígono está contenido en el otro), a la conectividad (si dos líneas están conectadas), etc.
- Las relaciones geométricas (de tipo cuantitativo) son las que se calculan a partir de las coordenadas de los objetos.
¿Qué relaciones, y de qué tipo, podemos encontrar en un plano de la red de metro de Valencia?
1.2.3.2 El componente temático
El componente temático se refiere a las características de los objetos presentados en un SIG utilizados para representar el mundo real. Estas características se conocen como los atributos o variables de una base de datos. De esta manera, cada objeto que representamos registra un determinado valor para cada uno de los atributos.
En la siguiente tabla se recogen varios ejemplos de atributos (variables) relativos a diferentes objetos representados, como son algunas provincias de España. Así, tenemos que a un objeto dibujado como un polígono que representa la provincia de La Coruña le podemos asignar diferentes atributos con distinto valor, como son la superficie, el número de habitantes, la densidad de población y el puesto según densidad. A estos atributos los denominamos características descriptivas de los elementos geométricos.
Provincia | Superficie | Núm. habitantes | Densidad de población | Orden |
---|---|---|---|---|
Cádiz | 7.440 | 1.194.062 | 160,5 | 2 |
Coruña | 7.951 | 1.129.141 | 142 | 3 |
Asturias | 10.604 | 1.076.896 | 101,5 | 4 |
Valencia | 10.776 | 2.463.592 | 228,6 | 1 |
Al mismo tiempo, los valores de cada atributo no presentan unas pautas de variación más o menos aleatorias, sino que es posible encontrar ciertas regularidades en su variación tanto espacial como temporal conocidas como autocorrelación espacial y autocorrelación temporal.
- La autocorrelación espacial es un principio básico en los SIG que establece que los valores temáticos tienden a ser más semejantes entre objetos próximos en el espacio que entre objetos situados lejos unos de otros.
- La autocorrelación temporal es un principio básico dado tanto en los SIG como también en otras disciplinas, que viene a definir un concepto equivalente a lo que hemos visto con la autocorrelación espacial: los datos próximos en el tiempo tienden a ser más semejantes entre sí que los más alejados. De la misma manera que en la variable espacial, los cambios en la variable temporal son graduales a medida que nos alejamos del punto de inicio o de referencia.
¿Qué dice y quién enunció la primera ley de la geografía?
Los atributos (variables) que constituyen la información temática de los objetos representados pueden ser de diferente tipo y afectan directamente a la generación de mapas y al tipo de análisis que se utilizará. En otras palabras, el usuario tiene que conocer el tipo de información con el que trabaja para realizar un análisis o mapa concreto.
Según los valores que presentan las variables, éstas pueden ser discretas o continuas:
- Las variables discretas son aquellas que toman valores específicos y separados, y no pueden tener valores intermedios entre estos. Se caracterizan por ser contables, como el número de estudiantes en una clase, la cantidad de coches en un estacionamiento, o el número de veces que ocurre un evento.
- Las variables continuas son aquellas que pueden tomar cualquier valor dentro de un rango específico, incluyendo fracciones o decimales infinitos. Se caracterizan por su capacidad de representar medidas y magnitudes, como la altura, el peso, la temperatura, o el tiempo, donde los valores pueden variar de manera fluida y no están limitados a números enteros o conteos específicos.
A diferencia de las variables anteriores, que se distinguen según la naturaleza matemática de sus valores, las variables fundamentales y las variables derivadas se distinguen por cómo se elaboran los valores obtenidos.
- Las variables fundamentales son las generadas directamente por el proceso de medición, como las que se podrían tomar directamente en el territorio de estudio: in situ.
- Las variables derivadas son el producto de alguna operación aritmética entre dos o más variables fundamentales.
1.2.3.3 El componente temporal
Una vez visto el componente espacial, entendido como el receptáculo que recibe la información, y el componente temático, entendido como la forma de medir los atributos de los objetos representados, sólo nos queda ver el tercer y último componente de los datos geográficos: el componente temporal, entendido como la manera de expresar los fenómenos geográficos de manera dinámica a lo largo del tiempo.
El componente temporal está intrínsecamente relacionado con los componentes espacial y temático. De esta manera, en un periodo de tiempo establecido para una zona territorial concreta, podremos analizar y observar los cambios de las unidades espaciales representadas (componente espacial), así como las nuevas características que presentan estas unidades espaciales (componente temático).
Fijémonos, por ejemplo, en los usos del suelo de un territorio. Si cogemos como mínimo dos mapas de usos del suelo de una misma zona pero de diferentes años, podemos observar cómo los diferentes polígonos que forman los mapas han ido cambiando el tamaño y la forma (cambio en el componente espacial), así como también el color (cambio temático).
Ahora ya podemos asociar el componente temporal a la idea del cambio. Pero ¿el transcurso del tiempo siempre lleva asociado un cambio espacial y temático? Supongamos, por ejemplo, una parcela de terreno de un municipio que a lo largo del tiempo no presenta modificaciones espaciales (no se ha ampliado ni disminuido la superficie), pero ha pasado de ser una zona de matorral a una zona agrícola. No hay cambios espaciales pero sí temáticos.
1.2.4 La importancia de los SIG en la sociedad actual
En los apartados anteriores hemos visto los SIG en cuanto a datos geográficos, sus componentes y sus funciones. Ahora vamos a abordar la influencia de los SIG en la sociedad actual, tratando de responder a las siguientes preguntas:
- ¿Quién utiliza los SIG?
- ¿Por qué y para qué se utilizan los SIG?
- ¿Qué repercusión tienen en la sociedad actual?
- ¿Qué tendencias presenta el futuro de los SIG?
Cada vez más, individuos y organizaciones de todo tipo utilizan los SIG para dar respuesta a una pregunta fundamental: ¿dónde? Cada vez más se le da mayor importancia a saber dónde ocurre qué cosa. Conocer dónde sucede algo es de vital importancia si queremos ir allí o si queremos enviar allí a alguien, o si queremos encontrar cierta información cerca de un determinado lugar o, simplemente, por ejemplo, si queremos informar a/de la gente que vive en los alrededores. La importancia del dónde es debida al gran crecimiento y evolución paralela y al desarrollo de las nuevas tecnologías, las cuales cada vez tienen una presencia más significativa en nuestras vidas cotidianas.
Otro punto que también ha influido en la utilización de los SIG es que el precio del hardware y del software ha disminuido sustancialmente en los últimos años a causa del rápido crecimiento de la demanda. En este caso, también se puede destacar el gran desarrollo del llamado software libre que, entre otras características, no tiene coste de licencia.
También debemos señalar otros motivos no menos importantes por los cuales los SIG están experimentando este crecimiento:
- Conciencia creciente de por qué los procesos de toma de decisiones tienen una dimensión espacial.
- Mejora de la facilidad de interacción del usuario mediante la utilización de entornos de trabajo estándar.
- Mejora de las tecnologías de soporte de las aplicaciones, específicamente en términos de visualización, gestión y análisis de datos, y de las relaciones con otro software.
- Proliferación de los datos digitales georeferenciados. Por ejemplo, los generados mediante tecnologías de sistemas de posicionamiento global (GPS).
- Experiencia acumulada de aplicaciones en cada campo de trabajo.
Hay una gran variedad de proyectos en los que pueden verse reflejados los beneficios del uso de los SIG, y hay diferentes formas de clasificar estas aplicaciones en los distintos dominios. Algunos autores se basan en las cuatro tradiciones de la geografía (social, espacial, ecológica y paisajista), otros distinguen los campos industriales a los que se aplican, otros clasifican las aplicaciones de los SIG según el sector en los que se aplican (público o privado), y otros autores se basan en sus áreas específicas de investigación.
Si examinamos ejemplos de casos de estudio de aplicaciones SIG, podemos diferenciar algunos grupos: gobierno, negocios, salud, transporte, utilidades, recursos naturales, medio ambiente, etc. Sin embargo, ¿por qué complicarse con la implementación de un SIG? A continuación se exploran algunas de las aplicaciones más importantes.
Administraciones Públicas. Las administraciones centrales o locales son las organizaciones que utilizan mayoritariamente los SIG. Más del 70% de las tareas en la administración están referenciadas geográficamente. Existen muchas aplicaciones que pueden ayudar en las diferentes tareas de gestión y decisiones políticas, como por ejemplo asesorías de impuestos, demarcaciones, seguros de hogar, soluciones catastrales, aplicaciones legislativas, seguridad pública, desarrollo sostenible, planeamiento urbano, etc.
El Geoportal del Ayuntamiento de Valencia es un ejemplo de aplicación de los SIG en las AAPP.
Catastro y planificación. La importancia del catastro y la planificación territorial es fundamental para el mantenimiento de nuestras vidas tal como las conocemos: alimentación, vivienda, entretenimiento y ocio, etc. La parcela de territorio es la unidad básica para el acceso, el control y las decisiones en el terreno. Los objetivos de mantener la información catastral y territorial son:
- Describir legalmente la propiedad en sistemas referenciados, para evitar problemas de límites ambiguos o superpuestos.
- Describir relaciones espacio-territoriales complejas como, por ejemplo, la evolución de una parcela privada en el desarrollo conjunto de la ciudad.
- Permitir el acceso al público.
La Oficina Virtual del Catastro ofrece atención al usuario que necesita obtener o consultar información catastral por Internet.
Empresas de servicios públicos. Los SIG se están convirtiendo en un requerimiento y componente estratégico en la infraestructura tecnológica de las empresas de servicios básicos o públicos (ESP). Estas empresas son las compañías de gas, teléfono, electricidad, agua y televisión por cable. Una sola compañía puede tener centenares o millones de clientes, varias redes y un gran número de tuberías, o líneas, además de transformadores, postes de electricidad o teléfono, lo cual representa billones de euros de infraestructuras instaladas.
La empresa Aguas de Valencia también tiene su propio SIG.
1.2.5 SIG para resolver problemas de negocios
¿Qué problemas de negocio se pueden resolver con datos espaciales?
Desde cómo identificar las mejores ubicaciones para nuevos puntos de venta, pasando por medición de infraestructura industrial o detección de focos de maleza en plantaciones a través del análisis de imágenes satelitales, hasta modelos de investigación de competidores y conteo de objetos a gran escala, las formas en que las empresas pueden aprovechar los datos espaciales son innumerables.
- Transporte y movilidad urbana:
- Modelos de optimización y gestión de tráfico terrestre, ferroviario y marítimo.
- Planificación y optimización de rutas de transporte público.
- Modelos para optimización de rutas de entrega entre centros de distribución y rutas de last-mile delivery.
- Modelos de identificación y conteo de todo tipo de vehículos.
- Industria y Logística:
- Modelos de detección y medición de objetos a gran escala.
- Optimización de rutas de distribución.
- Rastreo e identificación de insumos en cadenas logísticas y rutas de distribución.
- Uso y análisis de imágenes satelitales para optimizar modelos de prevención y protección de activos.
- Modelos para detección y medición de infraestructura industrial.
- Retail y consumo masivo:
- Optimización del proceso de selección de zonas para nuevos puntos de venta.
- Medición y caracterización de afluencia peatonal en tiendas, centros comerciales, supermercados y cualquier otro punto de venta.
- Optimización de canales y rutas de distribución.
- Identificación y caracterización de consumidores según su ubicación, tiempo de permanencia en centros comerciales u otros puntos de interés.
- Planificación de territorios para estrategias comerciales y de marketing.
- Modelos de detección y medición de objetos a gran escala.
- Mercado inmobiliario:
- Planificación urbana y desarrollo inmobiliario.
- Análisis de selección de sitios para proyectos inmobiliarios.
- Análisis de la evolución en el tiempo de áreas construidas.
- Identificación y análisis de infraestructura residencial, comercial, industrial.
- Complemento en el análisis de valoración de propiedades.
- Identificación y análisis de relaciones económicas y comerciales entre empresas, vía análisis de infraestructura física como bodegas, centros de distribución y otras propiedades.
1.3 Fuentes y adquisición de datos espaciales
La obtención de datos espaciales es un proceso fundamental en el análisis geoespacial, ya que la calidad, precisión y relevancia de los datos recolectados determinan la solidez de los resultados obtenidos. Este apartado se centra en describir las principales fuentes de datos espaciales, así como en explorar los conceptos y fundamentos que sustentan su adquisición y representación.
Para comprender plenamente cómo se generan y utilizan los datos espaciales, es necesario conocer algunos aspectos clave del ámbito geográfico. En este apartado, abordaremos conceptos fundamentales como la geodesia, las coordenadas geográficas y las proyecciones, los cuales son imprescindibles para la correcta interpretación y manejo de la información espacial.
1.3.1 Algunos conceptos geográficos
La representación de datos espaciales es el campo de estudio de la Cartografía, por lo que antes de continuar introduciremos algunos conceptos básicos de esta ciencia. A lo largo de la historia, el hombre ha sentido la necesidad de representar la superficie terrestre y los objetos situados sobre ella. El objetivo de los primeros mapas era servir de apoyo a la navegación, indicando los rumbos (direcciones) necesarios para ir de un puerto a otro. La exactitud en la representación de las tierras emergidas se consideraba accesoria, siendo lo fundamental la exactitud en rumbos y distancias entre puertos.
Las cartas náuticas actuales mantienen un sistema similar, aunque la generalización de los Sistemas de Posicionamiento Global (GPS) ha revolucionado los sistemas de navegación. En el siglo XVII, cartógrafos como Gerardus Mercator demostraron que un sistema de proyección geométrico, junto con un sistema de localización basado en coordenadas cartesianas, es decir, basadas en un par de ejes ortonormales (X e Y) formando una cuadrícula, mejoraba la fiabilidad de distancias, áreas o ángulos medidos sobre los mapas.
No obstante, la representación sobre un plano de un objeto como la Tierra reviste diversas dificultades:
- Si se proyecta sobre un plano un objeto esférico es inevitable que se produzcan distorsiones.
- La Tierra no es siquiera un objeto esférico, sino que su forma se aproxima a un elipsoide o esferoide ligeramente achatado en los polos.
- Esta aproximación tampoco es válida cuando se desciende al detalle, ya que la Tierra incluye numerosas irregularidades, hablando de Geoide para referirnos a la Tierra como objeto geométrico irregular.
1.3.2 Geodesia
La Geodesia es la ciencia que estudia la forma y tamaño de la Tierra y las posiciones sobre la misma. Esta ciencia define el geoide como una superficie en la que todos sus puntos experimentan la misma atracción gravitatoria, siendo esta equivalente a la experimentada al nivel del mar. Debido a las diferentes densidades de los materiales que componen la corteza y el manto terrestre, esta superficie no es regular, circunstancia que alteran los cálculos de localizaciones y distancias. Debido a estas irregularidades, suelen utilizarse modelos denominados esferoides o elipsoides de referencia. Estos se definen mediante dos parámetros, el tamaño del semieje mayor (\(a\)) y el tamaño del semieje menor (\(b\)). El achatamiento del esferoide se define mediante un coeficiente como:
\[ f=(a-b)/a \]
Con el paso del tiempo se han propuesto diversos elipsoides de referencia, generalmente conocidos con el nombre de su creador. La razón de tener diferentes esferoides es que ninguno de ellos puede adaptarse completamente a todas las irregularidades del Geoide, aunque cada uno se adapta a una zona concreta del planeta. Por tanto, en cada país se utilizará el más conveniente en función de la zona del planeta en que se encuentre, ya que el objetivo fundamental de un elipsoide es asignar a cada punto de la superficie del país donde se utiliza, un par de coordenadas geográficas.
Como hemos dicho, el elipsoide (definido por los parámetros \(a\) y \(b\)) es un modelo del Geoide, pero para poder asignar coordenadas geográficas a los diferentes puntos de la superficie es necesario “anclar” el elipsoide al Geoide mediante un punto fundamental en el que elipsoide y Geoide sean tangentes. Surge el concepto de datum, que es el conjunto formado por los parámetros \(a\) y \(b\) del elipsoide, las coordenadas geográficas del punto fundamental (latitud y longitud) y la dirección que define el Norte.
En España, el datum utilizado tradicionalmente en cartografía, tanto en los mapas del Servicio Geográfico del Ejército (SGE) como en los del Instituto Geográfico Nacional (IGN), es el European Terrestrial Reference System 1989 o ETRS89. No obstante, ante la necesidad de realizar estudios globales y dada la disponibilidad de dispositivos de toma de datos también globales (GPS) se busca que los datum tengan validez en todo el planeta, como el sistema de referencia World Geodetic System 1984 o WGS84 que suelen utilizar los GPS.
1.3.3 Coordenadas geográficas
Todos los objetos espaciales, tanto en R como en cualquier SIG, necesitan un sistema de coordenadas de referencia (Coordinate Reference System o CRS) que defina cómo se relaciona la información que contienen con la superficie de la Tierra. Esta relación, que en R es definida por el parámetro CRS, puede ser de dos tipos: geográfica o proyectada.
Los sistemas de coordenadas geográficos utilizan sistemas de medida angulares. La latitud (Norte-Sur) y la longitud (Este-Oeste), que se miden en grados, no son más que distancias desde una referencia concreta (el ecuador y el meridiano de Greenwich, respectivamente). Dicha premisa implica que este sistema de coordenadas asume la esfericidad de la Tierra, aunque ya hemos visto que en realidad el modelo más ajustado es el de un elipsoide, donde el radio del centro de la Tierra al ecuador y a los polos es diferente. Los elipsoides son más adecuados como modelo general, ya que la Tierra no es perfectamente esférica, sino que el radio polar es algo menor.
1.3.4 Proyecciones
El proceso de transformar las coordenadas geográficas en coordenadas planas para representar una parte de la superficie del elipsoide en dos dimensiones se conoce como proyección.
El problema fundamental a la hora de abordar una proyección es que no existe modo alguno de representar en un plano toda la superficie del elipsoide sin deformarla. El objetivo, por tanto, va a ser minimizar, en la medida de los posible, estas deformaciones. Puesto que el efecto de la esfericidad de la superficie terrestre es proporcional al tamaño del área representada, estos problemas sólo se plantean al cartografiar zonas amplias. Cuando se trata de cartografiar zonas pequeñas, por ejemplo una ciudad, la distorsión es despreciable.
Del mismo modo que ocurre con los elipsoides de referencia, durante los años han ido surgiendo diferentes proyecciones (planas, cilíndricas y cónicas), tomando cada una de ellas el nombre de su creador. En esta web se pueden visualizar algunos ejemplos.
La proyección UTM (Universal Transversa Mercator) es una de las más conocidas y utilizadas, también en España. La Tierra se divide en 60 husos, con una anchura de 6 grados de longitud. Se define un huso como las posiciones geográficas que ocupan todos los puntos comprendidos entre dos meridianos. A pesar de que es utilizado en casi toda la cartografía española, introduce un grave problema debido a que la Península Ibérica queda situada sobre tres husos: el 29, el 30 y el 31, mientras que las Islas Canarias se sitúan en el huso 28.
En cada uno de los husos el meridiano central tiene siempre un valor \(X=500000\) (metros), disminuyendo hacia el Oeste (hasta 0) y aumentando hacia el Este (hasta 1000 Km). En el Ecuador, \(Y\) toma el valor de \(0\), incrementándose el valor hacia el Norte y hacia el Sur. Los valores de la coordenada \(X\) en los bordes del huso dependen de la latitud. Este hecho trae dos complicaciones:
- Dos puntos diferentes de la superficie terrestre pueden tener las mismas coordenadas si se sitúan en husos diferentes. Por tanto, a la hora de señalar con precisión la localización de un punto, no basta con el par de coordenadas, es necesario dar también el huso.
- Una región situada a caballo entre dos husos deberá optar por uno u otro, con lo que se incrementan las deformaciones. De hecho, la cartografía española se genera asumiendo que toda la Península se sitúa en el huso 30, por lo que las deformaciones hacia los extremos Este y Oeste son mayores, alcanzándose un 4% de distorsión lineal.
Cuando definimos el CRS de una proyección geográfica, trasladamos a R cuáles son los parámetros de ajuste de nuestros datos a ese modelo teórico de la superficie terrestre. Estos parámetros, codificados en formato proj4string, permiten definir incluso cómo se han de tratar las pequeñas variaciones locales en áreas con orografía muy variada (p. ej.: áreas de montaña).
Así para definir en formato proj4string el sistema de coordenadas WGS84, su CRS será +proj=longlat +ellps=WGS84 +datum=WGS84 +no_defs
. En este caso solo se define la proyección, el elipsoide y el datum, pero, como esta cadena de parámetros sigue siendo difícil de recordar, podemos utilizar las abreviaturas definidas por European Petroleum Survey Group (EPSG). De esta manera, WGS84 podría definirse en R como CRS("+init=epsg:4326")
o, en formato abreviado, CRS=4326
.
Si trabajamos con dos objetos espaciales con diferente sistema de coordenadas, las operaciones de análisis espacial que queramos aplicar sobre ellos serán inútiles, ya que, a efectos prácticos, no tienen coincidencia espacial. Para solucionarlo, hay que cambiar el sistema de coordenadas de uno de ellos para que tenga coincidencia con el otro, o bien cambiar el de los dos por uno común. Este cambio de sistema de coordenadas, sea cual sea, por otro supone aplicar una transformación geográfica, que consiste en una serie de operaciones matemáticas para ajustar los parámetros de una proyección a otra. En R es una tarea muy sencilla que puede aplicarse, por ejemplo, con la función st_transform()
del paquete sf
.