Aprendizaje Computacional y Reconocimiento de Patrones (ACRP) |
---|
El conjunto de técnicas y métodos para la obtención de clasificadores o reconocedores tiene una base muy sólida y bien establecida. Estamos asistiendo a una proliferación de trabajos en la línea de actualización de conceptos y aplicación a problemas actuales. El factor común de estas iniciativas reside en el hecho de que la sociedad plantea nuevos y más complejos problemas que requieren de nuevas formulaciones que tengan en cuenta sus particularidades. Por ejemplo, la web es un ejemplo de dominio de aplicación en que: a) lo infructuoso de los posibles espacios de representación; b) lo vasto de los conjuntos (representativos) de ejemplos; y c) lo heterogéneo de los diferentes problemas que se pueden plantear, hacen que cualquier solución clásica no sea factible a la hora de reconocer patrones en este contexto. Si a esto añadimos aplicaciones en las que la información textual o hipertextual se combina con información visual, el nivel de complejidad crece desmesuradamente.
Los objetivos principales de esta línea de actuación son: los métodos de clasificación basados en ejemplos (vecinos más próximos, máquinas de vectores soporte y redes neuronales de tipo RBF); Selección de atributos y de prototipos; Sistemas de clasificadores múltiples: bagging, boosting; Clasificadores escalables; Clasificación incremental y sistemas de aprendizaje continuo; Clustering de datos heterogéneos; Clustering semi-supervisado; Componentes principales y componentes independientes en clasificación; Aplicaciones en minería de datos de tipo textual, hipertextual y visual; Aplicaciones biométricas; Clasificación y recuperación de información en grandes bases de datos; Algoritmos eficientes de búsqueda e indexación.
Representación y Tratamiento de Imágenes y Secuencias Naturales (RTIS) |
---|
Las imágenes son altamente redundantes porque una porción espacial o temporal de las señales puede predecirse de su entorno. Con objeto de optimizar la forma en que se procesa la información, cualquier sistema biológico o artificial dedicado al análisis de las imágenes naturales deberá organizar sus sensores de forma que maximice la independencia de sus respuestas. Esta hipótesis, que relaciona de manera fundamental la Teoría de la Información, el Reconocimiento Estadístico de Patrones y los modelos computacionales de Visión Humana, constituye el eje de esta línea de investigación.
El objetivo general de esta línea de trabajo es profundizar en la comprensión de la estadística de las imágenes y secuencias naturales para explicar así el funcionamiento de los sistemas de visión biológica y plantear soluciones novedosas en numerosas aplicaciones de procesado de imágenes y visión artificial en los que el núcleo del problema es la selección de una representación eficiente de la señal. El nexo de unión en las soluciones propuestas es la inspiración de los algoritmos en los modelos de visión humana asumiendo que las soluciones biológicas han evolucionado para el tratamiento óptimo de las imágenes naturales.
Las áreas básicas y aplicadas en las que venimos trabajando muestran esta interacción entre los modelos de sistema visual humano, la estadística de las imágenes naturales y las aplicaciones en procesado de imágenes: (i) Compresión de imágenes y vídeo; (ii) Estimación de movimiento; (iii) Restauración de imágenes; (iv) Técnicas para bases de datos de imágenes y codificación (selección de la representación de la textura y el color, y medidas de distancia); (v) Caracterización del comportamiento del sistema visual humano.
Análisis de Imágenes y Recuperación de información visual (AIR) |
---|
La clave en la recuperación de la información visual se fundamenta en una representación adecuada del contenido visual de las imágenes. Aspectos visuales de bajo nivel como el color, la textura, la forma, las relaciones espaciales o el movimiento junto con otros aspectos de alto nivel como el significado de los objetos y de las escenas se usan como claves para la recuperación de imágenes en la base de datos (BD). El uso de la información visual en la realización de una consulta surge de las propias limitaciones de los sistemas clásicos de recuperación basados en texto que no son adecuados para modelar la proximidad perceptual entre imágenes.
Los objetivos teóricos básicos de esta línea son: (i) Proponer nuevos descriptores de imágenes a nivel bajo sobre la forma, tamaño y textura basados en distribuciones de tamaño sobre imágenes a nivel de gris y en color; (ii) Desarrollar modelos de semejanza inspirados en lógica difusa que incorporen aspectos psicológicos más cercanos al criterio humano de semejanza, en colaboración con la línea RTIS. Los objetivos de carácter más práctico son: (i) Aplicación cerámica: valorar los descriptores y las medidas propuestas sobre una BD de azulejos cerámicos (se ha elegido esta aplicación por su enorme interés dentro de la Comunidad Valenciana); (ii) Aplicación a imágenes médicas: obtener información con el fin de comparar una patología entre un número determinado de pacientes con características similares o hacer un seguimiento de la evolución en comparación con otros enfermos (en concreto en bases de datos de córneas).
Robótica y Arquitecturas para la Percepción (RAP) |
---|
Los intereses científicos fundamentales de esta línea tienen que ver con la adquisición y proceso de señales de los sensores instalados a bordo de robots móviles. Actualmente se trabaja con un prototipo construido por miembros del grupo, que incluye sensores de ultrasonidos, infrarrojos y cámaras. El objetivo es el de determinar la localización del robot en su entorno, construir mapas hasta donde sea posible o útil y enlazar lo más directamente posible las señales de los sensores con las órdenes de control para los actuadores, cerrando el lazo de realimentación senso-motor al nivel más bajo posible. Ello permite la integración de los diversos módulos en arquitecturas de control predominantemente reactivas, aunque el marco de trabajo del actual robot, con un núcleo de sistema operativo apropiadamente modificado, permite la prueba sencilla de arquitecturas de control arbitrarias, desde las totalmente jerárquicas a las completamente reactivas. Estos objetivos fundamentales se plasman en otros más concretos, como son:
(i) La incorporación de nuevos tipos de sensores, o el uso de los habituales de modo alternativo. (ii) Investigación sobre el procesamiento de las señales visuales (imágenes) provistas por una cámara a bordo del robot por medio de hardware apropiado, en concreto lógica programable (FPGAs), que implementan algoritmos de visión útiles como la detección de objetos con movimiento propio (independiente de el del robot) o la determinación del tiempo hasta el impacto del robot móvil con un potencial obstáculo. (iii) La prueba de arquitecturas de control diversas. La modificación del núcleo del S.O. Linux permite probar de modo simple arquitecturas diversas, tanto funcionales como reactivas o mixtas. (iv) La sustitución progresiva del control clásico del robot por un control de tipo neuronal, usando modelos de redes neuronales (en particular, la CMAC).