Plan de estudiosLos estudios tenen una duración de 4 años (240 ECTS) |
---|
|
Primer semestre |
segUNDO semestre |
---|---|---|
1º |
Datos, Ciencia y Sociedad Fundamentos de Programación Matemática Discreta Álgebra Lineal Análisis Matemático |
Bases de datos Estructura de datos y algoritmos Probabilidad y Simulación Optimización Tratamiento de los datos |
2º |
Gestión de datos Señales y sistemas Inferencia estadística Aspectos legales sobre datos Infraestructura de almacenamiento de datos |
Procesado de imágenes Visualización de datos Modelos lineales Programación paralela Redes y seguridad |
3º |
Aprendizaje máquina Series temporales Agrupamientos y variedades Modelos bayesianos Empresa y ciencia de datos |
Procesado del lenguaje natural Modelos conexionistas Métodos cuantitativos para la gestión Gestión de la innovación en Ciencia de Datos Estadística para datos ómicos |
4º |
Internet de las cosas Economía y Ciencia de Datos Datos masivos Optativas (12 créditos) |
Optativas (6 créditos)
Prácticas en empresa (12 créditos) Trabajo Fin de Grado (12 créditos) |
ASIGNATURAS OBLIGATORIAS (6 créditos)
Datos, ciencia y sociedad
Ciencia de Datos: definición, objetivos y técnicas. Tipos de datos/ problemas/ aprendizaje. Etapas en un problema de datos. Aplicaciones en sociedad/economía/industria. Programas/Lenguajes usados en ciencia de datos. Procedimientos de evaluación de modelos basados en datos. Medidas de error. Problemas usuales: overfitting. Comunicación de resultados: investigación reproducible.
Fundamentos de Programación
Conceptos básicos de informática y herramientas del intérprete de comandos. Tipos de datos: simples y estructurados (arrays y registros). Estructuras de control. Programación modular. Entrada y Salida.
Matemática Discreta
Lógica y proposiciones. Lógica booleana. Conjuntos. Relaciones binarias. Conteos y combinatoria. Aritmética. Sucesiones. Recurrencia e Inducción. Grafos: caminos y ciclos, coloraciones, conexión, representación de grafos en programas. Árboles: tipos de árboles y bosques de árboles.
Álgebra Lineal
Vectores. Matrices. Espacios vectoriales y normas. Sistemas de ecuaciones lineales. Transformaciones. Procedimiento de Gramm-Schmidt. Valores y vectores propios de una matriz. Métodos numéricos para la resolución de sistemas lineales. Descomposiciones de matrices en valores singulares, en valores propios, LU y QR.
Análisis Matemático
Función de una variable. Series numéricas. Límites y continuidad. Derivadas e integrales. Teorema de Taylor. Funciones de varias variables. Diferenciabilidad. Gradiente y hessiano.
Bases de datos
Concepto y modelos de Bases de Datos. Modelo relacional de Bases de Datos. Lenguajes de consulta: SQL. Diseño de Bases de Datos: diseño conceptual, lógico y físico. Estructuras básicas de almacenamiento para Bases de Datos. Procesamiento de transacciones y propiedades ACID. Representación semántica de la información.
Estructura de datos y algoritmos
Diseño y análisis de algoritmos. Coste computacional. Estructuras de datos: listas, pilas, colas, árboles, grafos. Métodos de ordenación. Orientación a objetos. Encapsulación, herencia, polimorfismo.
Probabilidad y Simulación
Probabilidad. Cálculo de probabilidades. Variable aleatoria. Principales distribuciones discretas y continuas. Momentos. Transformaciones de variables aleatorias. Vectores aleatorios. Distribución conjunta, condicionada y marginal. Covarianzas y correlaciones. Distribución normal multivariante. Simulación (métodos Monte Carlo).
Optimización
Optimización sin restricciones. Diseño de funciones de coste. Optimización con restricciones. Extremos condicionados y multiplicadores de Lagrange. Métodos exactos. Tratabilidad: clases de problemas P y NP. Algoritmos de búsqueda. Metaheurísticos.
Tratamiento de los datos
Carga de datos. Selección y extracción de características. Preprocesado de los datos: normalización y estandarización. Datos ausentes y anómalos. Entropía. Codificación de la información. Transformación de variables. Filtrado. Detección de outliers. Clases desbalanceadas.
Gestión de datos
Bases de Datos paralelas y distribuidas. Optimización de consultas y optimización de consultas en entornos distribuidos. Almacenes de datos y modelos multidimensional de datos. Bases de datos NoSQL. Integración de datos y procesos de migración de datos.
Señales y sistemas
Caracterización de señales y secuencias, energía y potencia. Respuesta impulsional, convolución y correlación. Sistemas en el dominio temporal. Sistemas en el dominio transformado. Métodos de Fourier. Filtrado.
Inferencia estadística
Muestra y población. Población estadística. Máxima verosimilitud. Estimación y contraste de hipótesis. Intervalos de confianza y significatividad. Predicción. Poblaciones normales: comparación de una o varias poblaciones. Muestras emparejadas y muestras independientes. Proporciones: comparación de una o varias proporciones. Análisis de supervivencia.
Aspectos legales sobre datos
L.O.P.D europea y española: descripción y principales cuestiones. Ciberseguridad, aspectos legales. Propiedad intelectual y productos basados en datos. Nuevas cuestiones éticas/legales de la inteligencia artificial. Privacidad en la era del Big Data, aspectos legales. Identificación electrónica y servicios de confianza. Administración electrónica. Controles y garantías. Régimen jurídico. Procedimiento administrativo. Derechos de los ciudadanos. Seguridad de las relaciones telemáticas.
Infraestructura de almacenamiento de datos
Introducción a los SSOO y su administración. Almacenamiento local: discos duros, particiones, volúmenes lógicos, RAID. Sistemas de ficheros locales. Virtualización de recursos y sistemas operativos virtualizados. Hardware orientado a Big Data.
Procesado de imágenes
Representación de imágenes en niveles de gris y en color. Transformaciones de imágenes en el dominio espacial y frecuencial. Preprocesamiento de imágenes: manipulación del contraste, eliminación de ruido, realce de bordes. Formatos de imagen y métodos de compresión. Medidas de calidad de imagen. Extracción de características. Segmentación y clasificación.
Visualización de datos
Color y percepción. El proceso de visualización de la información. Elementos básicos de un sistema de visualización. Herramientas para el diseño de sistemas de visualización. Modelos de visualización: Tablas, gráficas, mapas de puntos, grafos. Datos espaciales y geográficos. Visualización de múltiples variables y dimensiones. Manipulación de vistas. Datos textuales. Gráficos interactivos
Modelos lineales
Regresión lineal simple y múltiple. Clasificación: Regresión logística, análisis lineal discriminante. Selección de variables. Métodos de regularización. Métodos de reducción de la dimensión: componentes principales y mínimos cuadrados parciales.
Programación paralela
Fundamentos de los sistemas paralelos y distribuidos. Paradigmas y modelos de programación de los sistemas paralelos y distribuidos. Programación multihilo. Criterios de evaluación de algoritmos/modelos paralelos (eficiencia).
Redes y seguridad
Introducción a las redes de computadores: estructura de capas y protocolos básicos de Internet. Virtualización de redes. Seguridad informática (SI): concepto de proceso de seguridad, evaluación de riesgos y de impacto, medidas preventivas, detección y tratamiento de incidentes, auditoría. Criptografía y sus aplicaciones: cifrado de datos almacenados y en tránsito (HTTPs, SSH, VPNs).
Aprendizaje máquina
Métodos de aprendizaje. Árboles de decisión/regresión. Métodos kernel. Funciones de kernel no-estándar. Métodos ensemble. Reglas de asociación. Aprendizaje reforzado.
Series temporales
Descomposición de las series temporales: localización, tendencia y estacionalidad. Modelos de suavizado exponencial. Modelos ARIMA. Modelos GARCH y NARX.
Agrupamiento y variedades
Clustering, concepto. Técnicas clásicas HCM y FCM. Clustering jerárquico, Spectral clustering y DBSCAN. Biclustering. Variedades (SOM, ISOMAP, LLE, T-SNE).
Modelos bayesianos
Probabilidad bayesiana. Distribución previa y a posteriori. Distribución predictiva previa y a posteriori. Intervalos de credibilidad. Proporciones y datos gaussianos. Contraste de hipótesis bayesiano. Redes bayesianas. Modelos gráficos probabilísticos.
Empresa y ciencia de datos
Fundamentos de organización de empresas. La empresa y sus áreas de decisión. Decisiones de marketing. Análisis del consumidor. Sistema de información marketing. Marketing analytics y Customer Relationship Marketing. Indicadores de eficacia y eficiencia de las decisiones de marketing.
Procesado del lenguaje natural
División de texto (tokenization), análisis morfológico (lemmatization), etiquetado gramatical (part-of-speech tagging), análisis de dependencia (dependency parsing), reconocimiento de entidades (named entity recognition). Modelos de lenguaje (n-gram, word embeddings). Aplicaciones: análisis de sentimientos, extracción de información, clasificación de documentos, sistemas de respuesta automática (question answering), traducción automática.
Modelos conexionistas
Neurona, concepto. Lógica borrosa. El perceptrón/adaline. Redes neuronales feed-forward shallow. Redes convolucionales. Sistemas Neuro-borrosos
Métodos cuantitativos para la gestión
Modelos input-output. Situaciones de equilibrio estático. Tendencias y análisis marginal. Elasticidad y análisis de sensibilidad. Análisis de equilibrio dinámico en tiempo continuo y discreto. Selección, filtrado y manejo de datos de fuentes primarias y secundarias (cuestionarios, encuestas y bases de datos).
Gestión de la innovación en Ciencia de Datos
Procesos de Innovación en el ámbito de la Ciencia de Datos. Plan estratégico basado en la Innovación. Generación y detección de ideas (creatividad, vigilancia tecnológica, benchmarking e inteligencia competitiva). Desarrollo de proyectos (diseño de modelos de negocio, gestión de proyectos de innovación, financiación, comunicación). Explotación de la innovación (mantenimiento y aseguramiento, transferencia y explotación, gestión del conocimiento).
Estadística para datos ómicos
Estadística y datos ómicos. R y Bioconductor. Anotación. Microarrays. Datos de RNA-seq. Expresión diferencial marginal. Comparaciones múltiples. Expresión diferencial con microarrays. Expresión diferencial con datos RNASeq. Generación de informes. Grupos de genes. Análisis de conjuntos de genes. Enriquecimiento de grafos. Agregación de listas y meta-análisis.
Internet de las cosas
Industria 4.0; Aplicaciones Smart (Smart-Cities, Smart-Tourism, Smart-Grid). Fuentes de información abiertas. Sensores. Datos en Streaming.
Economía y Ciencia de Datos
Macroeconomía: Macromagnitudes, Empleo/desempleo, Inflación, Balanza de pagos, Tipos de cambio, Política fiscal y monetaria. Microeconomía: Teoría de la producción, Estructura de mercado de competencia perfecta e imperfecta. Aplicaciones empíricas de la Econometría a la Economía. Técnicas econométricas de evaluación de políticas.
Datos masivos
Programación distribuida/paralela. Sistemas de ficheros distribuidos: HDFS. Modelo de programación MapReduce. Hadoop, Spark. Paralelización. Sistemas distribuidos a gran escala. Infraestructuras de computación en la nube. Servicios.
ASIGNATURAS OPTATIVAS (4.5 créditos)
Análisis y procesamiento de audio y voz
Análisis de la señal de voz. Reconocimiento automático del habla. Modelado acústico y del lenguaje. Reconocimiento del locutor. Síntesis del habla. Representaciones vectoriales de las palabras. Descriptores para señales de audio y musicales. Análisis de señales de audio. Información y recuperación en bases de datos de audio. Segmentación y detección de eventos en tramas de audio.
Analítica de datos en salud
Sistemas de ayuda a la decisión clínica. Desarrollo de un sistema experto en salud: etapas. Modelado de series temporales biomédicas. Farmacocinética/Farmacodinámica usando aprendizaje máquina. Optimización de dosis. Mejora de recursos hospitalarios. Desarrollo de una aplicación práctica.
Aprendizaje profundo
Problemas con sistemas multicapa profundos: soluciones. Autoencoders profundos, redes convolucionales profundas; redes recurrentes.
Analítica Web y redes sociales
Introducción a la analítica web y redes sociales. KPI (Key Performance Index) y técnicas analíticas. Agrupamiento de usuarios en la web. Informes. Analítica social. Análisis de sentimientos.
Sistemas dinámicos complejos
Teoría de juegos y cálculo de equilibrios. Modelización y simulación de sistemas dinámicos. Interacción en redes complejas. Emergencia de fenómenos colectivos en sistemas sociales.
Logística basada en datos
Problemas de localización. Distribución de productos y servicios: rutas por vértices y rutas por arcos. Gestión de almacenes. Problemas estáticos y dinámicos. Problemas multicriterio. Algoritmos exactos y heurísticos.
Finanzas y Ciencia de Datos
Decisiones de inversión. Criterios de valoración financiera. Rentabilidad y riesgo de activos. Selección de carteras. Inversiones bajo condiciones de incertidumbre. Inversiones socialmente responsables.
Análisis espacial y geográfico
Sistemas de información geográfica. Estudio de patrones puntuales. Geoestadística. Modelos Bayesianos de suavización espacial.
Métodos de Álgebra Lineal para Matrices Masivas de Datos
Estructuras de datos eficientes para matrices masivas de datos; métodos iterativos de proyección para sistemas lineales determinados y sobredeterminados (mínimos cuadrados); métodos de Arnoldi y Lanczos para descomposiciones parciales en valores y vectores propios o singulares; métodos de resolución de sistemas no lineales masivos.