Análisis Exploratorio de Datos y Bases de
Datos
Guía docente
En el siguiente enlace puedes acceder a la guía docente de Análisis
Exploratorio de Datos para el curso 2022-23.
Leer guía
docente.
Libro de referencia del curso
Para explicar el contenido de estadística de AED (temas 1 y 6) sigo
el manual: Esteban García, J. et al. Estadística descriptiva y
nociones de probabilidad (ver referencias básicas en la
guia docente). Las
presentaciones que utilizo en clase también están basadas en este
libro.
Importante: Podéis encontrar tres portadas diferentes para el libro
(ver imagen), pero todas son del mismo libro (la portada depende del año
de revisión del libro).
Instalación de R y RStudio
A lo largo del curso realizaremos algunas prácticas con R (que es un
programa libre, totalmente gratuito, de análisis estadístico). Por
tanto, es IMPRESCINDIBLE que os instaléis R y RStudio (la interfaz que
utilizaremos para trabajar) en vuestros ordenadores personales. OS
RECOMIENDO QUE VENGÁIS A CLASE DE PRÁCTICAS CON VUESTROS ORDENADORES.
Aquí tenéis una breve guía sobre como instalar R y RStudio.
GUIA
PARA LA INSTALACIÓN DE R Y RSTUDIO.
Presentaciones
Aquí encontraréis las presentaciones que utilizo en clase. Son sólo
un resumen; por tanto, os recomiendo trabajar el manual del curso o
cualquier otro manual de las referencias básicas que aparecen en la guía
docente.
WARNING: El contenido de los
materiales correspondientes a los temas es dinámico, los cambios son
frecuentes.
- Tema
1. Introducción al Análisis Exploratorio de
Datos.(Disponible al inicio del curso)
- Introducción.
- Tipos de variables. Escalas.
- Distribuciones de frecuencias unidimensionales. Tabulación de
datos.
- Resúmenes estadísticos: tendencia, dispersión y forma.
- Detección de valores anómalos y ausentes. Visualización.
- Tema 2. R
para el análisis estadístico de datos.
Introducción.(Disponible al inicio del
curso)
- Tipos de datos en R.
- Vectores, matrices, listas y dataframes.
- Funciones de la familia apply.
- Tema
3. Acceso, limpieza y depuración de datos.
(Disponible al inicio del curso)
- Fichero de texto: csv, txt.
- Formatos propietarios: Excel, SPSS, Stata, etc.
- Formatos de R: RData, rds.
- Acceso a datos a través de API, datos no estructurados, etc.
- Data cleaning: el proceso de limpieza y depuración de datos.
- Tema
4. Iniciación a la visualización de datos.
(Disponible al inicio del curso)
- Histograma.
- Diagrama de barras.
- Diagrama de caja (boxplot).
- Gráficos de líneas.
- Tema
5. Transformando los datos.(Disponible al inicio
del curso)
- ¿Qué son datos tidy?.
- Reshaping los datos: como pasas de formato ancho a formato long y al
contrario.
- gather()
- spread()
- separate()
- unite()
- Tema
6. Análisis de datos multidimensionales.
(Disponible al inicio del curso)
- Tablas de frecuencias conjuntas y marginales.
- Vector de medidas centrales y matriz de varainzas-covarianzas.
- Relación entre variables (covarianza, correlación, etc.).
- Regresión y predicción.
- Valores ausentes e imputación.
- Tema 7.
Data wrangling: Manejando/gestionando los datos.
(Disponible al inicio del curso)
- Gramática para el manejo de datos con R: el paquete dplyr.
- select()
- filter()
- group_by()
- summarize()
- arrange()
- mutate()
- Unir/fusionar bases de datos:
- Ideal: bind_cols() y bind_rows()
- Mutating joins: inner_join(), left_join(), right_join(),
full_join()
- Filtering joins: semi_join(), anti_join()
- Set operations: intersect(), union_all(), setdiff(), setequal()
Estadística II (grau Economia) (en valencià)
Guia docent
En el següent enllaç pots accedir a la guia docent de Introducció a
la Inferència Estadística oer al curs 2022-23.
Llegir la
guia
docent.
Llibre de referència
Teoria: ESTEBAN, J. y otros (2018). Inferencia Estadística. 2a
Edición revisada. Garceta, Madrid.
Pràctiques: MURGUI, J.S. y otros (2002). Ejercicios de
Estadística. Economía y Ciencias Sociales. Valencia: Tirant lo
Blanch.
Materials
Transparències, problemes, etc. estaran disponibles en
l’aula
virtual.
Tutorías
Las tutorías del primer semestre del curso 2022-2023 se realizarán en
el despacho 2F05 en el siguiente horario: