Tema 1. La imagen y el estudio de las imágenes.
Como punto de inicio en la materia que vamos a tratar, podemos explicar de manera general qué es el Análisis de Imagen.
Un análisis es la separación, identificación y en ocasiones cuantificación de las distintas partes de un sistema complejo. Ese sistema complejo en el caso del Análisis de Imagen es la imagen.
La imagen es una percepción visual de la realidad. No es la realidad. Nosotros percibimos las imágenes con la ayuda de unos órganos especializados en esta función, que son el cerebro y el órgano visual, cuando estos últimos reciben una serie de estímulos y éstos son procesados dando una respuesta particular.
Imaginemos que a varias personas se les presenta la siguiente figura y que nos preguntamos cuantas imágenes existen.
(Fig. 1.1)
Intuitivamente podríamos pensar que sólo existe una imagen, pero al hacerlo caemos en el error de olvidar que son las personas las que perciben las imágenes y que la capacidad de percepción es individual. Por ello, la respuesta correcta sería que existen tantas imágenes como personas hayan participado en esta actividad.
Además de generar imágenes, el cerebro humano puede operar con imágenes. La principales operaciones son cuatro:
Globalizar características de las imágenes.
Cuantificar características de las imágenes.
Comparar imágenes.
Clasificar imágenes.
De todas ellas, nuestro cerebro puede realizar mejor unas operaciones que otras. Por lo general, globaliza y compara con bastante eficiencia, pero cuando trata de cuantificar caracteres es bastante peor. Algunos ejercicios pueden poner esto de manifiesto.
La siguiente figura presenta una serie de elementos de forma rectangular. Supongamos que debemos averiguar si existen dos rectángulos iguales. Nuestro cerebro tendrá dificultades para encontrar la solución al problema porque para ello debemos cuantificar las dimensiones de los elementos de la imagen.
(Fig. 1.2)
Algo parecido sucedería si pidiésemos a una persona que averiguase la talla de un individuo a partir de una fotografía en la que el mismo apareciese junto a un objeto de tamaño conocido. La dificultad para cuantificar la relación entre la talla de la persona y el tamaño del objeto haría difícil responder.
La situación sería diferente si, sobre la figura que se presenta a continuación, se preguntase si son iguales sus tres partes.
Probablemente, la respuesta sería que sí y se daría con facilidad. A pesar de que no estaríamos cuantificando, nos daríamos cuenta de que, en conjunto, los elementos poseen suficientes caracteres para afirmarlo.
Ante las limitaciones del cerebro humano para obtener información a partir de las imágenes, el hombre ha aprendido a utilizar técnicas auxiliares. Esa mejora se consigue a tres niveles distintos:
El primero es la captación,la cual constituye un paso intermedio entre la realidad y nuestra percepción de la misma. A ese nivel, se ha desarrollado una serie de técnicas que permiten conseguir una percepción no humana de la realidad y, con ello, diferir la auténtica percepción y hacerla altamente objetiva. Para ello se utiliza una serie de soportes que permiten la obtención posterior de las imágenes. Estamos hablando de las cámaras fotográficas y de vídeo.
El segundo nivel es el de análisis. Se trata de cualquier proceso mediante el que pueda extraerse información cuantitativa de una imagen. Las técnicas de análisis son muy diversas. Desde el recuento a ojo de objetos o la medida con regla de un objeto sobre una fotografía, hasta los más modernos estudios mediante material informático de imágenes digitalizadas.
El tercer nivel es el del procesado. Se trata ahora de cualquier manipulación de una imagen para producir otra, generalmente con la intención de analizarla después
(Fig. 1.4)
En el apartado anterior hemos visto qué es una imagen y ahora puede ser interesante conocer cuales son los tipos principales de imágenes. A la hora de clasificar las imágenes es importante considerar la forma en que éstas se generan.
Las imágenes surgen de la interferencia entre ondas electromagnéticas y objetos materiales. De acuerdo con la clase de interferencia distinguimos tres tipos de imagen: imágenes de transmisión, imágenes de reflexión e imágenes de emisión.
Imágenes de transmisión.
En el caso de las imágenes de transmisión, las ondas electromagnéticas atraviesan el objeto, el cual se muestra más o menos resistente al paso de las mismas. En nuestra percepción, el órgano visual detecta como más intensos los puntos del objeto más permeables al paso de las ondas. Para que se pueda dar esta transmisión de ondas a pesar de la resistencia al paso de los objetos, éstos deben de ser objetos finos.
(Fig. 1.5)
Ejemplos de imágenes de transmisión los encontramos en microscopía óptica. En microscopía óptica la fuente de ondas electromagnéticas es un sistema iluminador mediante lámpara incandescente que emite luz. La luz debe concentrarse y enfocarse para atravesar la preparación y, finalmente, se dirige a través de un sistema óptico hasta una placa fotográfica que actúa como dispositivo de captación.
En microscopía electrónica de scaning también encontramos imágenes de transmisión. En este caso no hay lentes. Aquí se consigue un haz de electrones a partir de un filamento de tungsteno. Los electrones poseen poca capacidad de penetración, por lo que son acelerados mediante grandes diferencias de potencial. Las lentes utilizadas para condensar el haz son solenoides electromagnéticos. Tras atravesar la preparación, los electrones impactan sobre una pantalla fosforescente o sobre una placa fotográfica.
Imágenes de reflexión.
En las imágenes de reflexión, las ondas inciden sobre el objeto y se reflejan con un ángulo que depende principalmente del ángulo de incidencia. Se obtienen imágenes de este tipo mediante la lupa binocular y el microscopio electrónico de barrido.
En el caso de la lupa binocular, la fuente de luz es una bombilla que emite ondas luminosas que inciden sobre el objeto y se reflejan en parte, pudiendo ser captadas mediante una película fotográfica.
En el microscopio electrónico de barrido, la fuente de emisión es un haz de electrones como el del microscopio electrónico de transmisión pero ahora la incidencia del haz es con cierto ángulo, reflejándose los electrones en distintas direcciones, de modo que sólo algunos llegan a impactar sobre la película fotográfica que permite la captación.
Imágenes de emisión.
Las imágenes de emisión se producen por las ondas emitidas por el objeto, previa excitación por radiación de determinada longitud de onda.
El caso más característico es el del microscopio de fluorescencia, donde los objetos son iluminados con longitudes de onda apropiadas para producir la absorción de determinadas radiaciones (azul, violeta, ultravioleta) y la emisión de otras (a menudo roja, amarilla, verde y azul).
Ejercicio 1.1.
Indica el tipo al que corresponde cada una de las siguientes imágenes.
![]() |
![]() |
![]() |
1.3 Información contenida en las imágenes.
Cuando obtenemos imágenes tenemos un problema inherente y es que se da una pérdida de información respeto a la realidad. Vivimos en un mundo tridimensional y nos movemos en el espacio, pero cuando se capta una imagen obtenemos una plasmación bidimensional porque en su elaboración media la proyección de ondas electromagnéticas sobre un plano. En el caso de un ojo este plano es su retina; en las cámaras fotográficas, su placa; en las cámaras de vídeo, sus sensores.
A pesar de esto, las personas pueden percibir sensaciones espaciales, elaboradas por nuestro cerebro a partir de información virtual especial contenida en las imágenes.Es el caso de las líneas de fuga, que son líneas concurrentes en un punto de la imagen que dan la sensación de perspectiva o las luces y las sombras.
Por otra parte, la información que percibimos en una imagen es de dos tipos: espacial, tal como la forma, el tamaño o la distribución de los objetos, y espectral, relacionada con la intensidad con la que se reciben los tres colores básicos - rojo, verde y azul - de las imágenes cromáticas (RGB por red, green and blue).
Esa información, podemos vincularla a los puntos de un sistema cartesiano de cinco coordenadas (dos espaciales, correspondientes a la proyección plana de los objetos, y tres cromáticas):
Coordenada espacial x
Coordenada espacial y
Coordenada espectral ROJO
Coordenada espectral VERDE
Coordenada espectral AZUL
En ocasiones, debido a las herramientas usadas para la obtención de imágenes o para poder trabajar mejor con las mismas, se realiza una conversión de imágenes cromáticas (color) en monocromáticas (escala de grises) o en binarias (sólo dos colores). Esta conversión reduce el número de coordenadas a tres:
Coordenada espacial x
Coordenada espacial y.
Coordenada de intensidad de luz monocromática o binaria.
1.4 Digitalización de las imágenes.
Por lo general, las imágenes que obtenemos a través de sistemas de captación no son apropiadas para someterlas a análisis. A menudo, para eso necesitamos transformarlas y esa transformación requiere la conversión de magnitudes analógicas en digitales.
Como sabemos, las magnitudes analógicas poseen variación contínua y, por ello, representan más fielmente la dinámica de los procesos reales continuos (por ejemplo, la medida del tiempo mediante un reloj de manecillas). Por el contrario, las magnitudes digitales varían de modo discreto y , por ello, representan de modo más artificial la dinámica de los procesos reales contínuos (por ejemplo, la medida del tiempo mediante un reloj digital).
La digitalización consiste en la transformación de un modo de medir en otro. Esta digitalización suele implicar una pérdida de información, porque al estimar el número de unidades de medida que equivalen a la magnitud analógica hemos de redondear. La magnitud analógica (el valor real) está dentro del intervalo de la unidad correspondiente de la magnitud digital, pero, hecha la transformación, no es posible saber exactamente donde se encuentra.
A pesar de este problema, la digitalización tiene varias ventajas generales que la hacen necesaria en muchos campos de estudio y, entre ellos, el del análisis de imagen. Por una parte facilita el cálculo numérico y por otra simplifica el almacenamiento y copia de la información.
En el campo de las imágenes, digitalizar significa convertir en cifras las coordenadas analógicas de cada punto, es decir, las espaciales y las espectrales (Fig. 6).
En el caso de las coordenadas espaciales, cada punto de la imagen es proyectado sobre una estructura de diminutos puntos (pixels) o elementos sensibles a la luz, ordenados cartesianamente, los cuales están en el aparato de captación. Píxel, es la abreviatura de picture element o en castellano elemento de la imagen .
La resolución de una imagen digitalizada es el número de pixels. A mayor número de pixels, mayor resolución. Generalmente, cuanto más alto es el número de pixels, mayor es la calidad de la imagen, pero en la práctica hay que llegar a un compromiso entre la calidad deseada costo de los dispositivos necesarios para almacenar y manejar la información digital. Algunos ejemplos de resoluciones empleadas son: 128 x 128, 256 x 256 ó 512 x 512
En el caso de las coordenadas espectrales hablamos de intensidades de luz. Cada elemento sensible del aparato produce una intensidad de corriente proporcional a la intensidad de luz que recibe. Estos valores son llevados a una matriz de números que constituyen el resultado de la digitalización. Cada pixel, que ocupa una coordenada espacial dentro de la matriz XY, presentará tres valores de intensidad de luz cromática, o un valor de intensidad de luz monocromática.
(Fig. 1.6)
Para almacenar cada coordenada cromática suele usarse un byte (8 bits) de memoria, lo cual permite un total de 256 (2^8) niveles de intensidad de iluminación para el caso de luz cromática. Convencionalmente, para el caso de imágenes monocromáticas, los niveles de intensidad son 0 para el negro (intensidad nula) y 255 para el blanco (intensidad máxima).
A continuación se proponen algunos ejercicios prácticos, parte de los cuales requieren el uso del programa de análisis de imagen Visilog 5.
Ejecicio1. 2.
Ver los pixeles de una imagen digitalizada empleando el botón lupa de Visilog.
Ejercicio 1.3.
Digitalizar manualmente la imagen de la cara 6 del dado de juego, tanto como imagen monocromática como cromática.
Ejercicio 1.4.
Observar la resolución de algunas imágenes y calcular la cantidad de memoria necesaria para almacenarlas.
Visilog o cualquier otro programa de retoque fotográfico nos permitirá comprobar que la primera imágen es binaria y de resolución 179 x 98. La misma requiere, por tanto, 17.542 bytes para ser almacenada.
La segunda imagen es cromática y de resolución 699 x 451. Requiere, por tanto, 315.249 bytes para ser almacenada.