Análisis Exploratorio de Datos y Bases de Datos

Guía docente

En el siguiente enlace puedes acceder a la guía docente de Análisis Exploratorio de Datos para el curso 2024-25.

Leer guía docente.

Libro de referencia del curso

Para explicar todo el temario de la asignatura de AED sigo el manual: Introducción al Análisis Exploratorio de Datos. Aplicaciones con R y datos reales.

MANUAL BÁSICO ADAPTADO A LA ASIGNATURA

Clica sobre la imagen para acceder a la web del libro


Las presentaciones de clase, tanto en teoría como en práctica, están basadas en el manual básico de referencia del curso.


Instalación de R y RStudio

A lo largo del curso realizaremos algunas prácticas con R (que es un programa libre, totalmente gratuito, de análisis estadístico). Por tanto, es IMPRESCINDIBLE que os instaléis R y RStudio (la interfaz que utilizaremos para trabajar) en vuestros ordenadores personales. OS RECOMIENDO QUE VENGÁIS A CLASE DE PRÁCTICAS CON VUESTROS ORDENADORES.

Sobre cómo instalar R y RStudio: Capitulo 1 del libro.

Temario de la asignatura

  • Tema 1. Introducción al Análisis Exploratorio de Datos.
    (Teoría: CAPÍTULO 7; Práctica: CAPÍTULOS 2, 4, 5, 7)
    • Introducción.
    • Tipos de variables. Escalas.
    • Distribuciones de frecuencias unidimensionales. Tabulación de datos.
    • Resúmenes estadísticos: tendencia, dispersión y forma.
    • Detección de valores anómalos y ausentes. Visualización.
  • Tema 2. R para el análisis estadístico de datos. Introducción.
    (CAPÍTULO 2)
    • Tipos de datos en R.
    • Vectores, matrices, listas y dataframes.
    • Funciones de la familia apply.
  • Tema 3. Acceso, limpieza y depuración de datos.
    (CAPÍTULO 3)
    • Fichero de texto: csv, txt.
    • Formatos propietarios: Excel, SPSS, Stata, etc.
    • Formatos de R: RData, rds.
    • Acceso a datos a través de API, datos no estructurados, etc.
    • Data cleaning: el proceso de limpieza y depuración de datos.
  • Tema 4. Iniciación a la visualización de datos.
    (CAPÍTULO 5)
    • Histograma.
    • Diagrama de barras.
    • Diagrama de caja (boxplot).
    • Gráficos de líneas.
  • Tema 5. Transformando los datos.
    (CAPÍTULO 4)
    • ¿Qué son datos tidy?.
    • Reshaping los datos: como pasas de formato ancho a formato long y al contrario.
      • pivot_longer()
      • pivot_wider()
      • separate()
      • unite()
  • Tema 6. Análisis de datos multidimensionales.
    (Teoría: CAPÍTULO 8, 9; Práctica: CAPÍTULOS 2, 4, 5, 7, 8, 9)
    • Tablas de frecuencias conjuntas y marginales.
    • Vector de medidas centrales y matriz de varainzas-covarianzas.
    • Relación entre variables (covarianza, correlación, etc.).
    • Regresión y predicción.
    • Valores ausentes e imputación.

      Clase Teórico/Práctica martes 12 de noviembre



      Clase Teórico/Práctica martes 19 de noviembre



      Clase Teórico/Práctica martes 26 de noviembre



      Clase Teórico/Práctica martes 3 de diciembre


  • Tema 7. Data wrangling: Manejando/gestionando los datos.
    (CAPÍTULO 4)
    • Gramática para el manejo de datos con R: el paquete dplyr.
      • select()
      • filter()
      • group_by()
      • summarize()
      • arrange()
      • mutate()
    • Unir/fusionar bases de datos:
      • Ideal: bind_cols() y bind_rows()
      • Mutating joins: inner_join(), left_join(), right_join(), full_join()




Cálculo y Estadística

Guia docente

En el siguiente enlace puedes acceder a la guía docente (borrador) la “Cálculo y Estadística” del curso 2024-25.

Leer la guia docente.

Contenido

  • Tema 1. Funciones elementales y cálculos básicos.
    Potencias, logaritmos y escala logarítmica. Ecuaciones de primer grado en una variable.

  • Tema 2. Estadística descriptivaI. Análisis de una variable. (CAPÍTULO 1 del libro)
    Estadística descriptiva: Estadística en prevención de riesgos laborales. Variables, muestra y población. Tablas de frecuencias y gráficos estadísticos. Medidas de posición y de dispersión. PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON EXCEL

  • Tema 3. Estadística desriptiva II. Análisis conjunto de dos variables. (CAPÍTULO 2 del libro)
    Distribuciones de frecuencias conjuntas, marginales y condicionadas. Diagrama de dispersión. Covarianza y correlación. Medidas de asociación para variables cualitativas. PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON EXCEL

Clase online miércoles 13 de noviembre


Clase online miércoles 27 de noviembre


Clase online miércoles 4 de diciembre


  • Tema 4. Tasas de variación e índices. (CAPÍTULO 1 del libro)
    Tasas de crecimiento, absolutas y relativas. Índice de frecuencia, de gravedad y de incidencia.PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON EXCEL

  • Tema 5. Regresión lineal. (CAPÍTULO 3 del libro)
    Método de mínimos cuadrados. Ecuación de regresión. Coeficiente de correlación. Predicción.PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON EXCEL



Tutorías

Las tutorías del primer semestre del curso 2022-2024 se realizarán en el despacho 2F05 en el siguiente horario:

  • Martes: de 10:30h a 12:00h.
  • Jueves: de 10:00h a 11:30h.

SE REQUIERE CITA PREVIA.