Clases de teoría
La asignatura se imparte durante el primer cuatrimestre del curso académico. La duración de los temas para las clases de teoría y la distribución de las prácticas a lo largo del cuatrimestre se han representado en el diagrama inferior.
Tema 1. Modelos de RI avanzados.
En el tema 1 se hace una revisión de los modelos de Recuperación de Información más comunes que implementan los Sistemas de Gestión Documental. Se comienza por los modelos clásicos (booleano, vectorial, probabilístico) y se avanza hasta una serie de modelos más complejos, que aportan novedades interesantes para la recuperación. Se puede encontrar una descripción más detallada de este tema en el capítulo 2 del libro de Baeza, y el modelo probabilístico está bien tratado en el libro de Rijsbergen.
>>> Transparencias
Tema 2. Indexación y búsqueda.
En este tema se abordan algunos aspectos técnicos que intervienen en el proceso de la recuperación de información y de la resolución de consultas. Para ello se analizan diversos métodos de indexación de documentos, y se observa la forma de recuperar documentos (resolución de consultas) según los métodos de indexación utilizados. También se estudian algoritmos de búsqueda de texto (cuando no existe o no es posible la indexación). Por último, se aborda la ayuda a la resolución de consultas en varias iteraciones utilizando técnicas de control y de retroalimentación (feedback). Varios capítulos del libro de Baeza permiten completar el tema (4, 5 y 8). Algunos capítulos del libro de Frakes también sirven de apoyo en la comprensión de técnicas y algoritmos tratados en el tema. La parte de feedback se puede completar con el capítulo 9 del libro de Frants.
>>> Transparencias
Tema 3. Operaciones sobre el texto.
Es importante conocer la problemática asociada al tratamiento automático del texto para su indexación. En este tema se presentan los problemas que se deben abordar en el momento de indexar un documento y reconocer el texto que contiene, y para ello se estudian las técnicas que pueden facilitar el proceso de indexación de cara a obtener mejores rendimientos en las búsquedas. El capítulo 7 del libro de Baeza permite completar el tema.
>>> Transparencias
Tema 4. Búsquedas en el Web.
Hoy en día, el Web es el repositorio de información documental más grande que existe. Los esfuerzos realizados por indexar el Web han llevado a la aparición de multitud de búscadores que aplican diversas técnicas de indexación sobre los documentos que existen en los servidores web de toda la red. Estos buscadores tienes similitudes con los sistemas de recuperación de información, y es importante conocer como funcionan en líneas generales, las capacidades que poseen y las herramientas que ofrecen a los usuarios. De igual forma, es importante conocer los datos estadísticos que existen sobre el uso de buscadores para obtener una visión global del problema. Todo el material que se ofrece en este tema ha sido obtenido directamente del Web.
>>> Transparencias
Tema 5. Bibliotecas digitales.
Los SRI evolucionan hacia el concepto de Biblioteca Digital, en la cual no sólo existen objetos de información textuales, sino que además se almacenan datos en formato multimedia. El condepto de Biblioteca Digital no está completamente definido, y su funcionamiento es muy variable en los sistemas que existen en la actualidad. En este tema se pretende presentar el concepto de Biblioteca Digital desde múltiples perspectivas y ofrecer una visión de un marco de trabajo que permite comprender el tratamiento de la información que se puede llegar a realizar desde estos nuevos sistemas.
>>> Transparencias
Tema 6. Evaluación de los SRIs.
Una vez que se conoce el funcionamiento de los SRI, es neceario disponer de mecanismos que permitan evaluarlos. En este último tema se presentan unas medidas de evaluación muy utilizadas en este ámbito, y se relacionan con casos de experiencias reales (conferencia TREC), en las que el alumno podrá comprobar como las medidas utilizadas son de aplicación universal y se utilizan en contextos de trabajo de investigación a nivel internacional. El capítulo 3 del libro de Baeza es una buena referencia, al igual que la página web de la conferencia TREC.
>>> Transparencias