Logo de la Universdad de Valencia Logo Departamento de Informática Logo del portal

Antonio Fabregat, ganador del Premio Extraordinario de Doctorado de la UV

  • 12 julio de 2021
Antonio Fabregat, ganador del Premio Extraordinario de Doctorado de la UV

Antonio Fabregat Mundo ha recibido el Premio Extraordinario de Doctorado en el área de Ingeniería otorgado por la Universidad de Valencia para el curso 2020-2021. Este premio destaca la aplicación de la ingeniería informática en el área de la biomedicina cuyo valor se pone de manifiesto en su tesis doctoral «Performance optimisation of biological pathway data storage, retrieval, analysis and its interactive visualisation».

La tesis fue dirigida por los doctores Pablo Marín, experto en bioinformática clínica, y Vicente Arnau, profesor de la ETSE-UV. El objetivo de esta investigación era optimizar el rendimiento del almacenamiento, acceso, análisis y visualización interactiva de datos de rutas biológicas (biological pathways). Para ello, Fabregat adoptó una serie de nuevas tecnologías y una variedad de estructuras de datos, algoritmos y estrategias altamente optimizadas en las diferentes capas del software. Todo esto con el objetivo de construir una solución robusta, de alto rendimiento y extensible a la vez que mantenible. Dicha solución está implantada en Reactome, una base de datos de rutas biológicas accesible públicamente.

Entrando en detalles acerca del trabajo, cabe decir que las rutas biológicas están compuestas por una serie de pequeños pasos, llamados reacciones, mediante los cuales las células controlan su metabolismo y funcionalidad. Asimismo, el conjunto de rutas biológicas está conectado entre sí formando una compleja red entrelazada. El primer desafío que Fabregat tuvo que superar fue diseñar y desarrollar una herramienta web para la exploración interactiva de rutas biológicas llamada «Pathway Browser». Dicha herramienta fue creada con el doble objetivo de ser usada a gran escala al tiempo que debía ser extensible para facilitar la integración de diferentes módulos que, entre otras cosas, permitieran a los usuarios incluir y analizar sus propios datos.

En bioinformática, los métodos de análisis de rutas biológicas se pueden usar para identificar las proteínas o genes principales, dentro de una ruta biológica conocida, con respecto a un experimento determinado o a una condición patológica. Dichos métodos también se pueden usar para definir nuevas rutas biológicas a partir de proteínas o genes identificados como elementos principales en un experimento. Según indica Fabregat «otro desafío en esta tesis fue el desarrollo de una herramienta de alto rendimiento para permitir realizar el análisis de datos a lo largo de todo el genoma en cuestión de segundos». Una vez desarrollada esta herramienta, llamada «Pathway Analysis Tool», también se integró en el «Pathway Browser» permitiendo así la exploración y el análisis de los datos de los usuarios de forma interactiva en el contexto de las rutas biológicas.

La visualización de los resultados del análisis de rutas biológicas es un componente importante dentro del proceso que siguen los investigadores para llegar a una serie de conclusiones. Por este motivo, Fabregat aborda la visualización de rutas biológicas en dos niveles de granularidad; un nivel global, mediante el «Pathways Overview», donde cada ruta biológica se representa con un nodo dentro de un grafo cuyos ejes definen su organización jerárquica «parent-child» y un nivel específico para cada una de las rutas biológicas, donde se muestran las reacciones químicas junto con las moléculas que forman parte de éstas, en un componente llamado «Pathway Diagram Viewer».

Tanto el «Pathways Overview» como el «Pathway Diagram Viewer» permiten la superposición de los resultados de los análisis llevados a cabo con los datos de los usuarios. Con el «Pathways Overview», el objetivo es distinguir fácilmente los nodos relacionados con las áreas más importantes de la biología representada en dichos datos. Una vez reducido el conjunto de rutas biológicas a investigar, con el «Pathway Diagram Viewer» el objetivo es encontrar qué moléculas, de las especificadas en los datos de los usuarios, juegan un papel crucial en la patología investigada para poder identificar las que son clave.

En el caso del «Pathways Overview» para calcular de forma automática la disposición gráfica de los nodos del grafo, asociados con cada una de las rutas biológicas, se desarrolló un nuevo algoritmo determinista que sigue una representación radial. A su vez, para el «Pathway Diagram Viewer» se diseñó e implementó una nueva versión de la herramienta que como explica Fabregat; «logró la carga y visualización del 97% de los diagramas almacenados en la base de datos en menos de 1 segundo». Esta mejora en la visualización de los diagramas se consigue minimizando la carga de trabajo de la CPU gracias al uso de una estrategia HTML5 Canvas multicapa y una estructura de datos de partición del espacio (QuadTree). Otra ventaja de esta optimización fue que permitió introducir una serie de nuevas funcionalidades que mejoran aún más la experiencia del usuario.

Finalmente, para mejorar el rendimiento a la hora de almacenar y acceder a los datos, el trabajo se centró en la adopción de una base de datos de grafos (Neo4j) y en la creación de un nuevo servicio web (REST API), llamado «Content Service». Los datos se almacenan en el grafo siguiendo el complejo modelo definido en Reactome para representar las rutas biológicas. El uso de Neo4j y su lenguaje de consulta, Cypher, permite un acceso eficiente a estos datos, lo que facilita su exploración y el descubrimiento de nuevo conocimiento. La adopción de esta tecnología y estrategia mejoró enormemente la eficiencia de las consultas, reduciendo el tiempo medio de respuesta en un 93%.

Accede a la tesis: https://roderic.uv.es/handle/10550/67008

Enlaces a las publicaciones de la tesis: