Para explicar todo el temario de la asignatura de AED sigo el manual:
Introducción al Análisis Exploratorio de Datos. Aplicaciones con
R y datos reales.
Las presentaciones de clase, tanto en teoría como en práctica, están
basadas en el manual básico de referencia del curso.
Instalación de R y RStudio
A lo largo del curso realizaremos algunas prácticas con R (que es un
programa libre, totalmente gratuito, de análisis estadístico). Por
tanto, es IMPRESCINDIBLE que os instaléis R y RStudio (la interfaz que
utilizaremos para trabajar) en vuestros ordenadores personales. OS
RECOMIENDO QUE VENGÁIS A CLASE DE PRÁCTICAS CON VUESTROS
ORDENADORES.
Sobre cómo instalar R y RStudio:
Capitulo 1 del libro.
Temario de la asignatura
Tema 1. Introducción al Análisis Exploratorio de Datos. (Teoría: CAPÍTULO 7; Práctica: CAPÍTULOS
2, 4, 5, 7)
Introducción.
Tipos de variables. Escalas.
Distribuciones de frecuencias unidimensionales. Tabulación de
datos.
Resúmenes estadísticos: tendencia, dispersión y forma.
Detección de valores anómalos y ausentes. Visualización.
Tema 2. R para el análisis estadístico de datos.
Introducción. (CAPÍTULO 2)
Tipos de datos en R.
Vectores, matrices, listas y dataframes.
Funciones de la familia apply.
Tema 3. Acceso, limpieza y depuración de datos. (CAPÍTULO 3)
Fichero de texto: csv, txt.
Formatos propietarios: Excel, SPSS, Stata, etc.
Formatos de R: RData, rds.
Acceso a datos a través de API, datos no estructurados, etc.
Data cleaning: el proceso de limpieza y depuración de datos.
Tema 4. Iniciación a la visualización de datos. (CAPÍTULO 5)
Histograma.
Diagrama de barras.
Diagrama de caja (boxplot).
Gráficos de líneas.
Tema 5. Transformando los datos. (CAPÍTULO 4)
¿Qué son datos tidy?.
Reshaping los datos: como pasas de formato ancho a formato long y al
contrario.
pivot_longer()
pivot_wider()
separate()
unite()
Tema 6. Análisis de datos multidimensionales. (Teoría: CAPÍTULO 8, 9; Práctica:
CAPÍTULOS 2, 4, 5, 7, 8, 9)
Tablas de frecuencias conjuntas y marginales.
Vector de medidas centrales y matriz de varainzas-covarianzas.
Relación entre variables (covarianza, correlación, etc.).
Regresión y predicción.
Valores ausentes e imputación.
Clase Teórico/Práctica martes 12 de noviembre
Clase Teórico/Práctica martes 19 de noviembre
Clase Teórico/Práctica martes 26 de noviembre
Clase Teórico/Práctica martes 3 de diciembre
Tema 7. Data wrangling: Manejando/gestionando los datos. (CAPÍTULO 4)
Gramática para el manejo de datos con R: el paquete dplyr.
Tema 1. Funciones elementales y cálculos básicos. Potencias,
logaritmos y escala logarítmica. Ecuaciones de primer grado en una
variable.
Tema 2. Estadística descriptivaI. Análisis de una variable.
(CAPÍTULO 1 del libro) Estadística descriptiva: Estadística en prevención de riesgos
laborales. Variables, muestra y población. Tablas de frecuencias y
gráficos estadísticos. Medidas de posición y de dispersión.
PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON
EXCEL
Tema 3. Estadística desriptiva II. Análisis conjunto de dos
variables. (CAPÍTULO 2 del
libro) Distribuciones de frecuencias conjuntas,
marginales y condicionadas. Diagrama de dispersión. Covarianza y
correlación. Medidas de asociación para variables cualitativas.
PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON
EXCEL
Clase online miércoles 13 de noviembre
Clase online miércoles 27 de noviembre
Clase online miércoles 4 de diciembre
Tema 4. Tasas de variación e índices.
(CAPÍTULO 1 del libro) Tasas de crecimiento, absolutas y relativas. Índice de frecuencia,
de gravedad y de incidencia.PRÁCTICAS DE LOS
CONTENIDOS ESTUDIADOS CON EXCEL
Tema 5. Regresión lineal. (CAPÍTULO
3 del libro) Método de mínimos cuadrados. Ecuación
de regresión. Coeficiente de correlación.
Predicción.PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS
CON EXCEL
Tutorías
Las tutorías del primer semestre del curso 2022-2024 se realizarán en
el despacho 2F05 en el siguiente horario: