Análisis Exploratorio de Datos y Bases de Datos

Guía docente

En el siguiente enlace puedes acceder a la guía docente de Análisis Exploratorio de Datos para el curso 2022-23.

Leer guía docente.

Libro de referencia del curso

Para explicar el contenido de estadística de AED (temas 1 y 6) sigo el manual: Esteban García, J. et al. Estadística descriptiva y nociones de probabilidad (ver referencias básicas en la guia docente). Las presentaciones que utilizo en clase también están basadas en este libro.

Importante: Podéis encontrar tres portadas diferentes para el libro (ver imagen), pero todas son del mismo libro (la portada depende del año de revisión del libro).

/


Instalación de R y RStudio

A lo largo del curso realizaremos algunas prácticas con R (que es un programa libre, totalmente gratuito, de análisis estadístico). Por tanto, es IMPRESCINDIBLE que os instaléis R y RStudio (la interfaz que utilizaremos para trabajar) en vuestros ordenadores personales. OS RECOMIENDO QUE VENGÁIS A CLASE DE PRÁCTICAS CON VUESTROS ORDENADORES. Aquí tenéis una breve guía sobre como instalar R y RStudio.

GUIA PARA LA INSTALACIÓN DE R Y RSTUDIO.

Presentaciones

Aquí encontraréis las presentaciones que utilizo en clase. Son sólo un resumen; por tanto, os recomiendo trabajar el manual del curso o cualquier otro manual de las referencias básicas que aparecen en la guía docente.

WARNING: El contenido de los materiales correspondientes a los temas es dinámico, los cambios son frecuentes.

  • Tema 1. Introducción al Análisis Exploratorio de Datos.(Disponible al inicio del curso)
    • Introducción.
    • Tipos de variables. Escalas.
    • Distribuciones de frecuencias unidimensionales. Tabulación de datos.
    • Resúmenes estadísticos: tendencia, dispersión y forma.
    • Detección de valores anómalos y ausentes. Visualización.
  • Tema 2. R para el análisis estadístico de datos. Introducción.(Disponible al inicio del curso)
    • Tipos de datos en R.
    • Vectores, matrices, listas y dataframes.
    • Funciones de la familia apply.
  • Tema 3. Acceso, limpieza y depuración de datos. (Disponible al inicio del curso)
    • Fichero de texto: csv, txt.
    • Formatos propietarios: Excel, SPSS, Stata, etc.
    • Formatos de R: RData, rds.
    • Acceso a datos a través de API, datos no estructurados, etc.
    • Data cleaning: el proceso de limpieza y depuración de datos.
  • Tema 4. Iniciación a la visualización de datos. (Disponible al inicio del curso)
    • Histograma.
    • Diagrama de barras.
    • Diagrama de caja (boxplot).
    • Gráficos de líneas.
  • Tema 5. Transformando los datos.(Disponible al inicio del curso)
    • ¿Qué son datos tidy?.
    • Reshaping los datos: como pasas de formato ancho a formato long y al contrario.
      • gather()
      • spread()
      • separate()
      • unite()
  • Tema 6. Análisis de datos multidimensionales. (Disponible al inicio del curso)
    • Tablas de frecuencias conjuntas y marginales.
    • Vector de medidas centrales y matriz de varainzas-covarianzas.
    • Relación entre variables (covarianza, correlación, etc.).
    • Regresión y predicción.
    • Valores ausentes e imputación.
  • Tema 7. Data wrangling: Manejando/gestionando los datos. (Disponible al inicio del curso)
    • Gramática para el manejo de datos con R: el paquete dplyr.
      • select()
      • filter()
      • group_by()
      • summarize()
      • arrange()
      • mutate()
    • Unir/fusionar bases de datos:
      • Ideal: bind_cols() y bind_rows()
      • Mutating joins: inner_join(), left_join(), right_join(), full_join()
      • Filtering joins: semi_join(), anti_join()
      • Set operations: intersect(), union_all(), setdiff(), setequal()


Estadística II (grau Economia) (en valencià)

Guia docent

En el següent enllaç pots accedir a la guia docent de Introducció a la Inferència Estadística oer al curs 2022-23.

Llegir la guia docent.

Llibre de referència

  • Teoria: ESTEBAN, J. y otros (2018). Inferencia Estadística. 2a Edición revisada. Garceta, Madrid.

  • Pràctiques: MURGUI, J.S. y otros (2002). Ejercicios de Estadística. Economía y Ciencias Sociales. Valencia: Tirant lo Blanch.

Materials

Transparències, problemes, etc. estaran disponibles en l’aula virtual.



Tutorías

Las tutorías del primer semestre del curso 2022-2023 se realizarán en el despacho 2F05 en el siguiente horario:

  • Martes:
  • Miércoles: