Logo UVDegree in Data ScienceSchool of Engineering (ETSE) Logo del portal

Què aprendràs en les assignatures del Grau en Ciència de Dades?

  • June 28th, 2018

Pla d'estudis

Els estudis tenen una durada de 4 anys (240 ECTS)

 

 

Primer semestre

segon semestre

Dades, Ciència i Societat

Fonaments de Programació

Matemàtica Discreta

Àlgebra Lineal

Anàlisi Matemàtica

Bases de dades

Estructura de dades i algoritmes

Probabilitat i Simulació

Optimització

Tractament de les dades

Gestió de dades

Senyals i sistemes

Inferència estadística

Aspectes legals sobre dades

Infraestructura d’emmagatzemament de dades

Processat d’imatges

Visualització de dades

Models lineals

Programació paral·lela

Xarxes i seguretat

Aprenentatge màquina

Sèries temporals

Agrupament i varietats

Models bayesians

Empresa i ciència de dades

Processat del llenguatge natural

Models conexionistes

Mètodes quantitatives per a la gestió

Gestió de la innovació en Ciència de Dades

Estadística per a dades òmiques

Internet de les coses

Economia y Ciència de Dades

Dades massives

 

Optatives (12 crèdits)

Optatives (6 crèdits)

 

Pràctiques en empresa (12 crèdits)

 

Treball Fi de Grau (12 crèdits)

 

asSignaturEs obligatÒriEs  (6 crèdits)

Dades, ciència i societat

Ciència de dades: definició, objectius i tècniques. Tipus de dades/ problemes/ aprenentatge. Etapes en un problema de dades. Aplicacions en societat/economia/indústria. Programes/Llenguatges usats en Ciència de Dades. Procediments d’avaluació de models basats en dades. Mesures d’error. Problemes usuals: overfitting. Comunicació de resultats: investigació reproduïble.

 

Fonaments de Programació

Conceptes bàsics d’informàtica i ferramentes de l’intèrpret de comandaments. Tipus de dades: simples i estructurats (arrays i registres). Estructures de control. Programació modular. Entrada i Eixida.

 

Matemàtica Discreta

Lògica i proposicions. Lògica booleana. Conjunts. Relaciones binàries. Recomptes i combinatòria. Aritmètica. Successions. Recurrència i Inducció. Grafs: camins i cicles, coloracions, connexió, representació de grafs en programes. Arbres: tipus d’arbres i boscs d’arbres.

 

Àlgebra Lineal

Vectors. Matrius. Espais vectorials i normes. Sistemes d’equacions lineals. Transformacions. Procediment de Gramm-Schmidt. Valors i vectors propis d’una matriu. Mètodes numèrics per a la resolució de sistemes lineals. Descomposicions de matrius en valors singulars, en valors propis, LU i QR.

 

Anàlisi Matemàtica

Funció d’una variable. Sèries numèriques. Límits i continuïtat. Derivades i integrals. Teorema de Taylor. Funcions de diverses variables. Diferenciabilitat. Gradient i hessià.

 

Bases de Dades

Concepte i models de Bases de Dades. Model relacional de Bases de Dades. Llenguatges de consulta: SQL. Disseny de Bases de Dades: disseny conceptual, lògic i físic. Estructures bàsiques de emmagatzemament per a Bases de Dades. Processament de Transaccions i propietats ACID. Representació semàntica de la informació.

 

Estructura de dades i algoritmes

Disseny i anàlisi d’algoritmes. Cost Computacional. Estructures de dades: llistes, piles, cues, arbres, grafs. Mètodes d’ordenació. Orientació a objectes. Encapsulació, herència, polimorfisme.

 

Probabilitat i Simulació

Probabilitat. Càlcul de probabilitats. Variable aleatòria. Principals distribucions discretes i contínues. Moments. Transformacions de variables aleatòries. Vectors aleatoris. Distribució conjunta, condicionada i marginal. Covariàncies i correlacions. Distribució normal multivariante. Simulació (mètodes Monte Carlo).

 

Optimització

Optimització sense restriccions. Disseny de funcions de cost. Optimització amb restriccions. Extrems condicionats i multiplicadors de Lagrange. Mètodes exactes. Tractabilitat: classes de problemes P y NP. Algoritmes de cerca. Metaheurístics.

 

Tractament de les dades

Càrrega de dades. Selecció i extracció de característiques. Preprocessat de les dades: normalització i estandardització. Dades absentes i anòmales. Entropia. Codificació de la informació. Transformació de variables. Filtrat. Detecció d’outliers. Classes desbalancejades.

 

Gestió de dades

Bases de Dades paral·leles i distribuïdes. Optimització de consultes i optimització de consultes en entorns distribuïts. Magatzems de dades i models multidimensionals de dades. Bases de dades NoSQL . Integració de dades i processos de migració de dades.

 

 Senyals i sistemes

Caracterització de senyals i seqüencies, energia i potència. Resposta impulsional, convolució i correlació. Sistemes en el domini temporal. Sistemes en el domini transformat. Mètodes de Fourier. Filtrat.

 

Inferència estadística

Mostra i població. Població estadística. Màxima versemblança. Estimació i contrast d’hipòtesis. Intervals de confiança i significativitat. Predicció. Poblacions normals: comparació d’una o diverses poblacions. Mostres emparellades i mostres independents. Proporcions: comparació d’una o diverses proporcions. Anàlisi de supervivència.

 

Aspectes legals sobre dades

L.O.P.D europea i espanyola: descripció i principals qüestions. Ciberseguretat, aspectes legals. Propietat intel·lectual i productes basats en dades. Noves qüestiones ètiques/legals de la intel·ligència artificial. Privacitat en l’era del Big Data, aspectes legals. Identificació electrònica i serveis de confiança. Administració electrònica. Controls i garanties. Règim jurídic. Procediment administratiu. Drets dels ciutadans. Seguretat de les relaciones telemàtiques.

 

Infraestructura de emmagatzemament de dades

Introducció als SSOO i la seua administració. Emmagatzemament local: discs durs, particions, volums lògics, RAID. Sistemes de fitxers locals. Virtualització de recursos i sistemes operatius virtualitzats. Hardware orientat a Big Data.

 

Processat d’imatges

Representació d’imatges en nivells de gris i en color. Transformacions d’imatge en el domini espacial i freqüencial. Preprocessament d’imatges: manipulació del contrast, eliminació de soroll, realç de vores. Formats d’imatge i mètodes de compressió. Mesures de qualitat d’imatge. Extracció de característiques. Segmentació i classificació.

 

Visualització de dades

Color i percepció. El procés de visualització de la informació. Elements bàsics d’un sistema de visualització. Ferramentes per al disseny de sistemes de visualització. Models de visualització: Taules, gràfiques, mapes de punts, grafs. Dades espacials i geogràfiques. Visualització de múltiples variables i dimensions. Manipulació de vistes. Dades textuals. Gràfics interactius

 

Models lineals

Regressió lineal simple i múltiple. Classificació: Regressió logística, anàlisi lineal discriminant. Selecció de variables. Mètodes de regularització. Mètodes de reducció de la dimensió: Componentes principals i mínims quadrats parcials.

 

Programació paral·lela

Fonaments dels sistemes paral·lels i distribuïts. Paradigmes i models de programació dels sistemes paral·lels i distribuïts. Programació multifil. Criteris d’avaluació d’algoritmes/models paral·lels (eficiència).

Xarxes i seguretat

Introducció a les xarxes de computadors: estructura de capes i protocols bàsics d’Internet. Virtualització de xarxes. Seguretat informàtica (SI): concepte de procés de seguretat, avaluació de riscos i d’impacte, mesures preventives, detecció i tractament d’incidents, auditoria. Criptografia i les seues aplicacions: xifrat de dades emmagatzemades i en trànsit (HTTPs, SSH, VPNs).

 

Aprenentatge màquina

Mètodes d’aprenentatge. Arbres de decisió/regressió. Mètodes kernel. Funcions de kernel no-estàndard. Mètodes ensemble. Regles d’associació. Aprenentatge reforçat.

 

Sèries temporals

Descomposició de les sèries temporals: localització, tendència i estacionalitat. Models de suavitzat exponencial. Models ARIMA. Models GARCH i NARX.

 

Agrupament i varietats

Clustering, concepte. Tècniques clàssiques HCM y FCM. Clustering jeràrquic, Spectral clustering i DBSCAN. Biclustering. Varietats (SOM, ISOMAP, LLE,T-SNE).

 

Models bayesians

Probabilitat bayesiana. Distribució prèvia i a posteriori. Distribució predictiva prèvia y a posteriori. Intervals de credibilitat. Proporcions i dades gaussianes. Contrast d’hipòtesis bayesià. Xarxes bayesianes. Models gràfics probabilístics.

 

Empresa i ciència de dades

Fonaments d’organització d’empreses. L’empresa i les seues àrees de decisió. Decisions de màrqueting. Anàlisi del consumidor. Sistema d’informació màrqueting. Màrqueting analytics i Customer Relationship Marketing. Indicadors d’eficàcia i eficiència de les decisions de màrqueting.

 

Processat del llenguatge natural

Divisió de text (tokenization), anàlisi morfològica (lemmatization), etiquetat gramatical (part-of-speech tagging), anàlisi de dependència (dependency parsing), reconeixement d’entitats (named entity recognition). Models de llenguatge (n-gram, word embeddings). Aplicacions: anàlisi de sentiment, extracció d’informació, classificació de documents, sistemes de resposta automàtica (question answering), traducció automàtica.

 

Models conexionistes

Neurona, concepte. Lògica borrosa. El perceptró/adaline. Xarxes neuronals feed-forward shallow. Xarxes convolucionals. Sistemas Neuro-borrosos

Mètodes quantitatius per a la gestió

Models input-output. Situacions d’equilibri estàtic. Tendències i anàlisi marginal. Elasticitat i anàlisi de sensibilitat. Anàlisi d’equilibri dinàmic en temps continu i discret. Selecció, filtrat i maneig de dades de fonts primàries i secundaries (qüestionaris, enquestes i bases de dades).

 

Gestió de la innovació en Ciència de Dades

Processos d’Innovació en l’àmbit de la Ciència de Dades. Pla estratègic basat en la Innovació. Generació i detecció d’idees (creativitat, vigilància tecnològica, benchmarking i intel·ligència competitiva). Desenvolupament de projectes (disseny de models de negoci, gestió de projectes d’innovació, finançament, comunicació). Explotació de la innovació (manteniment i assegurament, transferència i explotació, i gestió del coneixement).

 

Estadística per a dades òmiques

Estadística i dades òmiques. R i Bioconductor. Anotació. Microarrays. Dades de RNA-seq. Expressió diferencial marginal. Comparacions múltiples. Expressió diferencial amb microarrays. Expressió diferencial amb dades RNASeq. Generació d’informes. Grups de gens. Anàlisi de conjunts de gens. Enriquiment de grafs. Agregació de llistes i meta-anàlisi.

 

Internet de les coses

Indústria 4.0; Aplicacions Smart (Smart-Cities, Smart-Tourism, Smart-Grid). Fonts d’informació obertes. Sensors. Dades en Streaming.

 

Economia i Ciència de Dades

Macroeconomia: Macromagnituds, Ocupació/atur, Inflació, Balança de pagaments, Tipus de canvi. Política fiscal i monetària. Microeconomia: Teoria de la producció, Estructura de mercat de competència perfecta i imperfecta. Aplicacions empíriques de l’Econometria a l’Economia. Tècniques economètriques d’avaluació de polítiques.

 

Dades massives

Programació distribuïda/paral·lela. Sistemes de fitxers distribuïts: HDFS. Model de programació MapReduce. Hadoop, Spark. Paral·lelització. Sistemas distribuïts a gran escala. Infraestructures de computació en el núvol. Serveis.

 

ASIGNATURES OPTATIVES (4.5 crèdits)

 

Anàlisi i processament d’àudio i veu

Anàlisis del senyal de veu. Reconeixement automàtic de la parla. Modelat acústic i del llenguatge. Reconeixement del locutor. Síntesi de la parla. Representacions vectorials de les paraules. Descriptors per a senyals d’àudio i musicals. Anàlisi de senyals d’àudio. Informació i recuperació en bases de dades d’àudio. Segmentació i detecció d’esdeveniments en trames d’àudio.

 

Analítica de dades en salut

Sistemes d’ajuda a la decisió clínica. Desenvolupament d’un sistema expert en salut: etapes. Modelat de sèries temporals biomèdiques. Farmacocinètica/ Farmacodinàmica usant aprenentatge màquina. Optimització de dosis. Millora de recursos hospitalaris. Desenvolupament d’una aplicació pràctica.

 

Aprenentatge profund 

Problemes amb sistemes multicapa profunds: solucions. Autoencoders profunds, xarxes convolucionals profundes; xarxes recurrents.

 

Analítica Web i xarxes socials

Introducció a l’analítica web i xarxes socials. KPI (Key Performance Index) i tècniques analítiques. Agrupament d’usuaris en la web. Informes. Analítica social. Anàlisi de sentiments.

 

Sistemes dinàmics complexos

Teoria de jocs y càlcul d’equilibris. Modelització i simulació de sistemes dinàmics. Interacció en xarxes complexes. Emergència de fenòmens col·lectius en sistemes socials.

 

Logística basada en dades

Problemes de localització. Distribució de productes i serveis: rutes per vèrtexs i rutes per arcs. Gestió de magatzems. Problemes estàtics i dinàmics. Problemes multicriteri. Algoritmes exactes i heurístics.

 

Finances i Ciència de Dades

Decisions d’inversió. Criteris de valoració financera. Rendibilitat i risc d’actius. Selecció de carteres. Inversions sota condicions d’incertesa. Inversions socialment responsables.

 

Anàlisi espacial i geogràfica

Sistemes d’informació geogràfica. Estudi de patrons puntuals. Geoestadística. Models Bayesians de suavització espacial.

 

Mètodes d’Àlgebra Lineal per a Matrius Massives de Dades

Estructures de dades eficients per a matrius massives de dades; mètodes iteratius de projecció per a sistemes lineals determinats i sobredeterminats (mínims quadrats); mètodes d’Arnoldi i Lanczos per a descomposicions parcials en valors i vectors propis o singulars; mètodes de resolució de sistemes no lineals massius.