Análisis Exploratorio de Datos y Bases de Datos
Guía docente
En el siguiente enlace puedes acceder a la guía docente de Análisis Exploratorio de Datos para el curso 2021-22.
Leer guía docente.
Libro de referencia del curso
Para explicar el contenido de estadística de AED (temas 1 y 6) sigo el manual: Esteban García, J. et al. Estadística descriptiva y nociones de probabilidad (ver referencias básicas en la guia docente). Las presentaciones que utilizo en clase también están basadas en este libro.
Importante: Podéis encontrar tres portadas diferentes para el libro (ver imagen), pero todas son del mismo libro (la portada depende del año de revisión del libro).
Instalación de R y RStudio
A lo largo del curso realizaremos algunas prácticas con R (que es un programa libre, totalmente gratuito, de análisis estadístico). Por tanto, es IMPRESCINDIBLE que os instaléis R y RStudio (la interfaz que utilizaremos para trabajar) en vuestros ordenadores personales. OS RECOMIENDO QUE VENGÁIS A CLASE DE PRÁCTICAS CON VUESTROS ORDENADORES. Aquí tenéis una breve guía sobre como instalar R y RStudio.
GUIA PARA LA INSTALACIÓN DE R Y RSTUDIO.
Presentaciones
Aquí encontraréis las presentaciones que utilizo en clase. Son sólo un resumen; por tanto, os recomiendo trabajar el manual del curso o cualquier otro manual de las referencias básicas que aparecen en la guía docente.
WARNING: El contenido de los materiales correspondientes a los temas es dinámico, los cambios son frecuentes.
- Tema 1. Introducción al Análisis Exploratorio de Datos.
- Introducción.
- Tipos de variables. Escalas.
- Distribuciones de frecuencias unidimensionales. Tabulación de datos.
- Resúmenes estadísticos: tendencia, dispersión y forma.
- Detección de valores anómalos y ausentes. Visualización.
- Tema 2. R para el análisis estadístico de datos. Introducción.
- Tipos de datos en R.
- Vectores, matrices, listas y dataframes.
- Funciones de la familia apply.
- Tema 3. Acceso, limpieza y depuración de datos.
- Fichero de texto: csv, txt.
- Formatos propietarios: Excel, SPSS, Stata, etc.
- Formatos de R: RData, rds.
- Acceso a datos a través de API, datos no estructurados, etc.
- Data cleaning: el proceso de limpieza y depuración de datos.
- Tema 4. Iniciación a la visualización de datos.
- Histograma.
- Diagrama de barras.
- Diagrama de caja (boxplot).
- Gráficos de líneas.
- Tema 5. Transformando los datos.
- ¿Qué son datos tidy?.
- Reshaping los datos: como pasas de formato ancho a formato long y al contrario.
- gather()
- spread()
- separate()
- unite()
- Tema 6. Análisis de datos multidimensionales.
- Tablas de frecuencias conjuntas y marginales.
- Vector de medidas centrales y matriz de varainzas-covarianzas.
- Relación entre variables (covarianza, correlación, etc.).
- Regresión y predicción.
- Valores ausentes e imputación.
- Tema 7. Data wrangling: Manejando/gestionando los datos.
- Gramática para el manejo de datos con R: el paquete dplyr.
- select()
- filter()
- group_by()
- summarize()
- arrange()
- mutate()
- Unir/fusionar bases de datos:
- Ideal: bind_cols() y bind_rows()
- Mutating joins: inner_join(), left_join(), right_join(), full_join()
- Filtering joins: semi_join(), anti_join()
- Set operations: intersect(), union_all(), setdiff(), setequal()
Postgrados (Títulos propios UVEG)
Master en Gestión Integral para Establecimientos Sanitarios Ópticos
- Técnicas Cuantitativas Aplicadas a la Gestión de Establecimientos Ópticos
Master en Gestión de la Opinión Pública
- Análisis de Datos y Evaluación de la Información
- Tratamiento Avanzado de la Información
Tutorías
Las tutorías del primer semestre del curso 2021-2022 se realizarán los miércoles de 10:30 a 13:30 en el despacho 2F05.