Análisis Exploratorio de Datos y Bases de Datos

Guía docente

En el siguiente enlace puedes acceder a la guía docente de Análisis Exploratorio de Datos para el curso 2023-24.

Leer guía docente.

Libro de referencia del curso

Para explicar todo el temario de la asignatura de AED sigo el manual: Introducción al Análisis Exploratorio de Datos. Aplicaciones con R y datos reales.

MANUAL DE REFERENCIA ADAPTADO A LA ASIGNATURA

Puedes comprar el libro en: https://www.leanpub.com/analisis_exploratorio_datos_con_R


Las presentaciones de clase, tanto de teoría como de práctica, están basadas en el manual de la asignatura.


Instalación de R y RStudio

En el curso vamos a utilizar R (que es un programa libre, totalmente gratuito, de análisis estadístico) para realizar las prácticas. Por tanto, es IMPRESCINDIBLE que os instaléis R y RStudio (la interfaz que utilizaremos para trabajar) en vuestros ordenadores personales. OS RECOMIENDO QUE VENGÁIS A CLASE DE PRÁCTICAS CON VUESTROS ORDENADORES. Aquí tenéis una breve guía sobre como instalar R y RStudio.

GUIA PARA LA INSTALACIÓN DE R Y RSTUDIO.

Temario de la asignatura


¡EN PROCESO DE CAMBIO!
  • Tema 1. Introducción al Análisis Exploratorio de Datos.
    • Introducción.
    • Tipos de variables. Escalas.
    • Distribuciones de frecuencias unidimensionales. Tabulación de datos.
    • Resúmenes estadísticos: tendencia, dispersión y forma.
    • Detección de valores anómalos y ausentes. Visualización.
  • Introducción a R y RStudio. Primero pasos.
  • Tema 2. R para el análisis estadístico de datos. Introducción.
    • Tipos de datos en R.
    • Vectores, matrices, listas y dataframes.
    • Funciones de la familia apply.
  • Tema 3. Acceso, limpieza y depuración de datos.
    • Fichero de texto: csv, txt.
    • Formatos propietarios: Excel, SPSS, Stata, etc.
    • Formatos de R: RData, rds.
    • Acceso a datos a través de API, datos no estructurados, etc.
    • Data cleaning: el proceso de limpieza y depuración de datos.
  • Tema 4. Iniciación a la visualización de datos.
    • Histograma.
    • Diagrama de barras.
    • Diagrama de caja (boxplot).
    • Gráficos de líneas.
  • Tema 5. Transformando los datos.
    • ¿Qué son datos tidy?.
    • Reshaping los datos: cómo pasar de formato ancho a formato long y al contrario.
      • gather()
      • spread()
      • separate()
      • unite()
  • Tema 6. Análisis de datos multidimensionales.
    • Tablas de frecuencias conjuntas y marginales.
    • Vector de medidas centrales y matriz de varainzas-covarianzas.
    • Relación entre variables (covarianza, correlación, etc.).
    • Regresión y predicción.
    • Valores ausentes e imputación.
  • Tema 7. Data wrangling: Manejando/gestionando los datos.
    • Gramática para el manejo de datos con R: el paquete dplyr.
      • select()
      • filter()
      • group_by()
      • summarize()
      • arrange()
      • mutate()
    • Unir/fusionar bases de datos:
      • Ideal: bind_cols() y bind_rows()
      • Mutating joins: inner_join(), left_join(), right_join(), full_join()


Cálculo y Estadística

Guia docente

En el siguiente enlace puedes acceder a la guía docente la “Cálculo y Estadística” del curso 2023-24.

Leer la guia docente.

Libro de referencia

  • Teoria: ESTEBAN, J. y otros (2018). Inferencia Estadística. 2a Edición revisada. Garceta, Madrid.

  • Pràctiques: MURGUI, J.S. y otros (2002). Ejercicios de Estadística. Economía y Ciencias Sociales. Valencia: Tirant lo Blanch.

Materiales

WARNING: El contenido de los materiales correspondientes a los temas es dinámico, los cambios son frecuentes.

  • Tema 1. Funciones elementales y cálculos básicos. Potencias, logaritmos y escala logarítmica. Ecuaciones de primer grado en una variable.
    El contenido de este tema será estudiando al trabajar los contenidos del resto de temas.

  • Tema 2. Estadística descriptiva. (Actualizado, se han corregido errores)
    Variables, muestra y población. Tablas de frecuencias y gráficos estadísticos. Medidas de posición y de dispersión.
    PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON EXCEL

  • Tema 5. Relación lineal entre dos variables y predicción. (Disponible)
    Relación lineal entre dos variables y predicción: Distribuciones bidimensionales. Diagramas de dispersión. Regresión lineal: Método de mínimos cuadrados. Ecuación de regresión. Coeficiente de correlación. Predicción. PRÁCTICAS DE LOS CONTENIDOS ESTUDIADOS CON EXCEL



Tutorías

Las tutorías del primer semestre del curso 2022-2024 se realizarán en el despacho 2F05 en el siguiente horario:

  • Martes: de 10:30h a 12:00h.
  • Jueves: de 10:00h a 11:30h.

SE REQUIERE CITA PREVIA.









------------------------------------------
Vicente Coll Serrano. Facultad de Economía. Universidad de Valencia.