Logo UVGrado en Ciencia de DatosEscuela Técnica Superior de Ingeniería (ETSE) Logo del portal

¿Qué aprenderás en las asignaturas del Grado en Ciencia de Datos?

  • 28 junio de 2018

Plan de estudios

Los estudios tenen una duración de 4 años (240 ECTS)

 

 

Primer semestre

segUNDO semestre

Datos, Ciencia y Sociedad

Fundamentos de Programación

Matemática Discreta

Álgebra Lineal

Análisis Matemático

Bases de datos

Estructura de datos y algoritmos

Probabilidad y Simulación

Optimización

Tratamiento de los datos

Gestión de datos

Señales y sistemas

Inferencia estadística

Aspectos legales sobre datos

Infraestructura de almacenamiento de datos

Procesado de imágenes

Visualización de datos

Modelos lineales

Programación paralela

Redes y seguridad

Aprendizaje máquina

Series temporales

Agrupamientos y variedades

Modelos bayesianos

Empresa y ciencia de datos

Procesado del lenguaje natural

Modelos conexionistas

Métodos cuantitativos para la gestión

Gestión de la innovación en Ciencia de Datos

Estadística para datos ómicos

Internet de las cosas

Economía y Ciencia de Datos

Datos masivos

Optativas (12 créditos)

Optativas (6 créditos)

 

Prácticas en empresa (12 créditos)

Trabajo Fin de Grado (12 créditos)

 

ASIGNATURAS OBLIGATORIAS  (6 créditos)

 

Datos, ciencia y sociedad

Ciencia de Datos: definición, objetivos y técnicas. Tipos de datos/ problemas/ aprendizaje. Etapas en un problema de datos. Aplicaciones en sociedad/economía/industria. Programas/Lenguajes usados en ciencia de datos. Procedimientos de evaluación de modelos basados en datos. Medidas de error. Problemas usuales: overfitting. Comunicación de resultados: investigación reproducible.

 

Fundamentos de Programación

Conceptos básicos de informática y herramientas del intérprete de comandos. Tipos de datos: simples y estructurados (arrays y registros). Estructuras de control. Programación modular. Entrada y Salida.

 

Matemática Discreta

Lógica y proposiciones. Lógica booleana. Conjuntos. Relaciones binarias. Conteos y combinatoria. Aritmética. Sucesiones. Recurrencia e Inducción. Grafos: caminos y ciclos, coloraciones, conexión, representación de grafos en programas. Árboles: tipos de árboles y bosques de árboles.

 

Álgebra Lineal

Vectores. Matrices. Espacios vectoriales y normas. Sistemas de ecuaciones lineales. Transformaciones. Procedimiento de Gramm-Schmidt. Valores y vectores propios de una matriz. Métodos numéricos para la resolución de sistemas lineales. Descomposiciones de matrices en valores singulares, en valores propios, LU y QR.

 

Análisis Matemático

Función de una variable. Series numéricas. Límites y continuidad. Derivadas e integrales. Teorema de Taylor. Funciones de varias variables. Diferenciabilidad. Gradiente y hessiano.

 

Bases de datos

Concepto y modelos de Bases de Datos. Modelo relacional de Bases de Datos. Lenguajes de consulta: SQL. Diseño de Bases de Datos: diseño conceptual, lógico y físico. Estructuras básicas de almacenamiento para Bases de Datos. Procesamiento de transacciones y propiedades ACID. Representación semántica de la información.

 

Estructura de datos y algoritmos

Diseño y análisis de algoritmos. Coste computacional. Estructuras de datos: listas, pilas, colas, árboles, grafos. Métodos de ordenación. Orientación a objetos. Encapsulación, herencia, polimorfismo.

 

Probabilidad y Simulación

Probabilidad. Cálculo de probabilidades. Variable aleatoria. Principales distribuciones discretas y continuas. Momentos. Transformaciones de variables aleatorias. Vectores aleatorios. Distribución conjunta, condicionada y marginal. Covarianzas y correlaciones. Distribución normal multivariante. Simulación (métodos Monte Carlo).

 

Optimización

Optimización sin restricciones. Diseño de funciones de coste. Optimización con restricciones. Extremos condicionados y multiplicadores de Lagrange. Métodos exactos. Tratabilidad: clases de problemas P y NP. Algoritmos de búsqueda. Metaheurísticos.

 

Tratamiento de los datos

Carga de datos. Selección y extracción de características. Preprocesado de los datos: normalización y estandarización. Datos ausentes y anómalos. Entropía. Codificación de la información. Transformación de variables. Filtrado. Detección de outliers. Clases desbalanceadas.

 

Gestión de datos

Bases de Datos paralelas y distribuidas. Optimización de consultas y optimización de consultas en entornos distribuidos. Almacenes de datos y modelos multidimensional de datos. Bases de datos NoSQL. Integración de datos y procesos de migración de datos.

 

Señales y sistemas

Caracterización de señales y secuencias, energía y potencia. Respuesta impulsional, convolución y correlación. Sistemas en el dominio temporal. Sistemas en el dominio transformado. Métodos de Fourier. Filtrado.

 

Inferencia estadística

Muestra y población. Población estadística. Máxima verosimilitud. Estimación y contraste de hipótesis. Intervalos de confianza y significatividad. Predicción. Poblaciones normales: comparación de una o varias poblaciones. Muestras emparejadas y muestras independientes. Proporciones: comparación de una o varias proporciones. Análisis de supervivencia.

 

Aspectos legales sobre datos

L.O.P.D europea y española: descripción y principales cuestiones. Ciberseguridad, aspectos legales. Propiedad intelectual y productos basados en datos. Nuevas cuestiones éticas/legales de la inteligencia artificial. Privacidad en la era del Big Data, aspectos legales. Identificación electrónica y servicios de confianza. Administración electrónica. Controles y garantías. Régimen jurídico. Procedimiento administrativo. Derechos de los ciudadanos. Seguridad de las relaciones telemáticas.

 

Infraestructura de almacenamiento de datos

Introducción a los SSOO y su administración. Almacenamiento local: discos duros, particiones, volúmenes lógicos, RAID. Sistemas de ficheros locales. Virtualización de recursos y sistemas operativos virtualizados. Hardware orientado a Big Data.

 

Procesado de imágenes

Representación de imágenes en niveles de gris y en color. Transformaciones de imágenes en el dominio espacial y frecuencial. Preprocesamiento de imágenes: manipulación del contraste, eliminación de ruido, realce de bordes. Formatos de imagen y métodos de compresión. Medidas de calidad de imagen. Extracción de características. Segmentación y clasificación.

 

Visualización de datos

Color y percepción. El proceso de visualización de la información. Elementos básicos de un sistema de visualización. Herramientas para el diseño de sistemas de visualización. Modelos de visualización: Tablas, gráficas, mapas de puntos, grafos. Datos espaciales y geográficos. Visualización de múltiples variables y dimensiones. Manipulación de vistas. Datos textuales. Gráficos interactivos

 

Modelos lineales

Regresión lineal simple y múltiple. Clasificación: Regresión logística, análisis lineal discriminante. Selección de variables. Métodos de regularización. Métodos de reducción de la dimensión: componentes principales y mínimos cuadrados parciales.

 

Programación paralela

Fundamentos de los sistemas paralelos y distribuidos. Paradigmas y modelos de programación de los sistemas paralelos y distribuidos. Programación multihilo. Criterios de evaluación de algoritmos/modelos paralelos (eficiencia).

 

Redes y seguridad

Introducción a las redes de computadores: estructura de capas y protocolos básicos de Internet. Virtualización de redes. Seguridad informática (SI): concepto de proceso de seguridad, evaluación de riesgos y de impacto, medidas preventivas, detección y tratamiento de incidentes, auditoría. Criptografía y sus aplicaciones: cifrado de datos almacenados y en tránsito (HTTPs, SSH, VPNs).

 

Aprendizaje máquina

Métodos de aprendizaje. Árboles de decisión/regresión. Métodos kernel. Funciones de kernel no-estándar. Métodos ensemble. Reglas de asociación. Aprendizaje reforzado.

 

Series temporales

Descomposición de las series temporales: localización, tendencia y estacionalidad. Modelos de suavizado exponencial. Modelos ARIMA. Modelos GARCH y NARX.

 

Agrupamiento y variedades

Clustering, concepto. Técnicas clásicas HCM y FCM. Clustering jerárquico, Spectral clustering y DBSCAN. Biclustering. Variedades (SOM, ISOMAP, LLE, T-SNE).

 

Modelos bayesianos

Probabilidad bayesiana. Distribución previa y a posteriori. Distribución predictiva previa y a posteriori. Intervalos de credibilidad. Proporciones y datos gaussianos. Contraste de hipótesis bayesiano. Redes bayesianas. Modelos gráficos probabilísticos.

 

Empresa y ciencia de datos

Fundamentos de organización de empresas. La empresa y sus áreas de decisión. Decisiones de marketing. Análisis del consumidor. Sistema de información marketing. Marketing analytics y Customer Relationship Marketing. Indicadores de eficacia y eficiencia de las decisiones de marketing.

 

Procesado del lenguaje natural

División de texto (tokenization), análisis morfológico (lemmatization), etiquetado gramatical (part-of-speech tagging), análisis de dependencia (dependency parsing), reconocimiento de entidades (named entity recognition). Modelos de lenguaje (n-gram, word embeddings). Aplicaciones: análisis de sentimientos, extracción de información, clasificación de documentos, sistemas de respuesta automática (question answering), traducción automática.

 

Modelos conexionistas

Neurona, concepto. Lógica borrosa. El perceptrón/adaline. Redes neuronales feed-forward shallow. Redes convolucionales. Sistemas Neuro-borrosos

 

Métodos cuantitativos para la gestión

Modelos input-output. Situaciones de equilibrio estático. Tendencias y análisis marginal. Elasticidad y análisis de sensibilidad. Análisis de equilibrio dinámico en tiempo continuo y discreto. Selección, filtrado y manejo de datos de fuentes primarias y secundarias (cuestionarios, encuestas y bases de datos).

 

Gestión de la innovación en Ciencia de Datos

Procesos de Innovación en el ámbito de la Ciencia de Datos. Plan estratégico basado en la Innovación. Generación y detección de ideas (creatividad, vigilancia tecnológica, benchmarking e inteligencia competitiva). Desarrollo de proyectos (diseño de modelos de negocio, gestión de proyectos de innovación, financiación, comunicación). Explotación de la innovación (mantenimiento y aseguramiento, transferencia y explotación, gestión del conocimiento).

 

Estadística para datos ómicos

Estadística y datos ómicos. R y Bioconductor. Anotación. Microarrays. Datos de RNA-seq. Expresión diferencial marginal. Comparaciones múltiples. Expresión diferencial con microarrays. Expresión diferencial con datos RNASeq. Generación de informes. Grupos de genes. Análisis de conjuntos de genes. Enriquecimiento de grafos. Agregación de listas y meta-análisis.

 

Internet de las cosas

Industria 4.0; Aplicaciones Smart (Smart-Cities, Smart-Tourism, Smart-Grid). Fuentes de información abiertas. Sensores. Datos en Streaming.

 

Economía y Ciencia de Datos

Macroeconomía: Macromagnitudes, Empleo/desempleo, Inflación, Balanza de pagos, Tipos de cambio, Política fiscal y monetaria. Microeconomía: Teoría de la producción, Estructura de mercado de competencia perfecta e imperfecta. Aplicaciones empíricas de la Econometría a la Economía. Técnicas econométricas de evaluación de políticas.

Datos masivos

Programación distribuida/paralela. Sistemas de ficheros distribuidos: HDFS. Modelo de programación MapReduce. Hadoop, Spark. Paralelización. Sistemas distribuidos a gran escala. Infraestructuras de computación en la nube. Servicios.

 

ASIGNATURAS OPTATIVAS (4.5 créditos)

 

Análisis y procesamiento de audio y voz

Análisis de la señal de voz. Reconocimiento automático del habla. Modelado acústico y del lenguaje. Reconocimiento del locutor. Síntesis del habla. Representaciones vectoriales de las palabras. Descriptores para señales de audio y musicales. Análisis de señales de audio. Información y recuperación en bases de datos de audio. Segmentación y detección de eventos en tramas de audio.

Analítica de datos en salud

Sistemas de ayuda a la decisión clínica. Desarrollo de un sistema experto en salud: etapas. Modelado de series temporales biomédicas. Farmacocinética/Farmacodinámica usando aprendizaje máquina. Optimización de dosis. Mejora de recursos hospitalarios. Desarrollo de una aplicación práctica.

 

Aprendizaje profundo 

Problemas con sistemas multicapa profundos: soluciones. Autoencoders profundos, redes convolucionales profundas; redes recurrentes.

 

Analítica Web y redes sociales

Introducción a la analítica web y redes sociales. KPI (Key Performance Index) y técnicas analíticas. Agrupamiento de usuarios en la web. Informes. Analítica social. Análisis de sentimientos.

 

Sistemas dinámicos complejos

Teoría de juegos y cálculo de equilibrios. Modelización y simulación de sistemas dinámicos. Interacción en redes complejas. Emergencia de fenómenos colectivos en sistemas sociales.

 

Logística basada en datos

Problemas de localización. Distribución de productos y servicios: rutas por vértices y rutas por arcos. Gestión de almacenes. Problemas estáticos y dinámicos. Problemas multicriterio. Algoritmos exactos y heurísticos.

 

Finanzas y Ciencia de Datos

Decisiones de inversión. Criterios de valoración financiera. Rentabilidad y riesgo de activos. Selección de carteras. Inversiones bajo condiciones de incertidumbre. Inversiones socialmente responsables.

 

Análisis espacial y geográfico

Sistemas de información geográfica. Estudio de patrones puntuales. Geoestadística. Modelos Bayesianos de suavización espacial.

 

Métodos de Álgebra Lineal para Matrices Masivas de Datos

Estructuras de datos eficientes para matrices masivas de datos; métodos iterativos de proyección para sistemas lineales determinados y sobredeterminados (mínimos cuadrados); métodos de Arnoldi y Lanczos para descomposiciones parciales en valores y vectores propios o singulares; métodos de resolución de sistemas no lineales masivos.