UVdocènciaUniversitat de València Logo del portal

TÉCNICAS ESTADÍSTICAS DE VISUALIZACIÓN Y VALIDEZ POBLACIONAL CON R MEDIANTE “DATOS PRAGMÁTICOS Y FÓNICAS

Destinatarios PDI, PIF
Modalidad de impartición Presencial
Lengua Castellano
Duración total 15
Duración presencial 15
Programa Convocatoria 'Docencia e investigación'
Modalidad formativa Curso
Curso académico 2025-2026
Edición 01
Any del pla de formació 2026
Fecha de inicio del curso 29/05/2026
Fecha de finalización del curso 10/06/2026
Fecha de inicio de inscripción 05/05/2026
Fecha de finalización de inscripción 12/05/2026
Sesiones
Sesión Fecha y hora de inicio Fecha y hora de finalización Aula Ubicación
1 29/05/2026 09:30 29/05/2026 13:30 Aula 1.2 SFPIE Servicio de Formación Permanente e Innovación Educativa (SFPIE)
2 05/06/2026 09:30 05/06/2026 13:30 Aula 1.2 SFPIE Servicio de Formación Permanente e Innovación Educativa (SFPIE)
3 09/06/2026 09:30 09/06/2026 13:30 Aula 1.2 SFPIE Servicio de Formación Permanente e Innovación Educativa (SFPIE)
4 10/06/2026 09:30 10/06/2026 12:30 Aula 1.2 SFPIE Servicio de Formación Permanente e Innovación Educativa (SFPIE)
Profesorado UV
  • Cabedo Nebot, Adrian
  • PDI-Catedratic/a d'Universitat
Ver ficha
Objetivos formativos
  • Adquirir habilidades avanzadas en el manejo de bases de datos lingüísticas más allá de las hojas de cálculo tradicionales como Excel o Google Sheets.
  • Familiarizarse con el programa R, aprendiendo los conceptos básicos de programación y análisis de datos en este entorno.
  • Desarrollar la capacidad de representar datos de manera efectiva utilizando técnicas de visualización avanzadas, incluyendo barras, lolipops, diagramas de caja y líneas temporales utilizando GGplot2 en R.
  • Adquirir habilidades avanzadas en el análisis de datos, utilizando diversas técnicas estadísticas y de visualización, como Mosaicplot y pruebas de chi cuadrado para explorar relaciones entre variables categóricas, análisis de correspondencias múltiples para identificar patrones en datos multidimensionales, la construcción de árboles de decisiones para tomar decisiones basadas en datos y la exploración de relaciones no lineales, así como la generación de mapas de calor para visualizar patrones de correlación y tendencias en datos numéricos.
  • Dominar las estrategias previas al análisis inferencial: transformación de variables (logarítmica, z-score), evaluación de la normalidad mediante pruebas (Shapiro‑Wilk, Kolmogorov‑Smirnov) y detección y tratamiento de valores atípicos.
  • Aplicar modelos de regresión logística (binaria y multinomial) para predecir y explicar variables dependientes categóricas a partir de predictores lingüísticos, sociales o contextuales, interpretando correctamente coeficientes, odds ratios y significación estadística.
  • Ajustar e interpretar modelos lineales y logísticos de efectos mixtos (paquetes lme4 y lmerTest) para modelar correctamente la variabilidad asociada a hablantes en datos lingüísticos, distinguiendo entre efectos fijos y aleatorios y valorando el ajuste del modelo.
Contenidos
  • Análisis y explotación de una base de datos lingüística: más allá de Excel/Goole Sheets
  • Introducción básica al manejo del programa R
  • Preparación y transformación de los datos
    • Limpieza y reestructuración de datos con dplyr y tidyr (pivot_longer, pivot_wider, mutate, filter, group_by)
    • Transformaciones numéricas: logaritmo, z-score, escalado
    • Evaluación de la normalidad: Shapiro‑Wilk, Kolmogorov‑Smirnov.
    • Detección y gestión de valores atípicos
  • Técnicas estadísticas de visualización y contraste poblacional
    • Visualización descriptiva (barras, lolipops, diagramas de caja, líneas temporales…) con GGplot2.
    • Visualización avanzada: raincloud plots (ggdist), composición de gráficos con patchwork, paletas accesibles (viridis, colorblindr) y visualización de efectos marginales con ggeffects
    • Mosaicplot y chi cuadrado
    • Análisis múltiple de correspondencias
    • Árboles de decisiones
    • Mapas de calor
  • Regresión logística para variables dependientes categóricas
    • Regresión logística binaria con glm(): ajuste, interpretación de coeficientes y odds ratios
    • Regresión logística multinomial (nnet::multinom) para variables con 3 o más niveles
    • Diagnóstico y evaluación del modelo: pseudo‑R², matriz de confusión, curvas ROC y visualización de predicciones con ggeffects
  • Modelos de efectos mixtos aplicados a datos lingüísticos
    • Fundamentos: efectos fijos vs. aleatorios; intercepts; estructura jerárquica de los datos
    • Modelos lineales mixtos (lme4::lmer) para variables continuas (F0, duración, intensidad…) con efectos aleatorios por hablante
    • Modelos logísticos mixtos (lme4::glmer) para variables dependientes binarias
    • Obtención de valores p (lmerTest), comparación de modelos (anova, AIC/BIC) y tamaños de efecto (r2)
    • Comunicación de resultados: informe de efectos aleatorios
Competencias que se desarrollarán

En este curso, utilizaremos datos lingüísticos, específicamente datos pragmáticos y fónicos, como ejemplos prácticos para aprender a trabajar con R y desarrollar habilidades estadísticas avanzadas. Sin embargo, es importante comprender que el enfoque principal de este curso va más allá de los datos lingüísticos en sí. Las técnicas y pruebas que aprenderán aquí son universales y se pueden aplicar a una amplia gama de datos en diferentes campos y disciplinas. Nuestro objetivo es capacitar a quienes asistan para que se conviertan en analistas de datos competentes y versátiles que puedan abordar y resolver problemas utilizando R y técnicas estadísticas, independientemente del tipo de datos con el que trabajen en el futuro.

Al finalizar el curso los estudiantes deben ser capaces de:

  1. Comprender y explorar una base de datos más allá de las capacidades básicas de herramientas como Excel o Google Sheets. Esto implica habilidades para manipular datos, identificar patrones y realizar análisis descriptivos.
  2. Aplicar habilidades básicas en el manejo del programa R, incluyendo la capacidad para importar datos, realizar operaciones de limpieza y transformación de datos, y ejecutar análisis estadísticos y visualizaciones utilizando paquetes y funciones en R.
  3. Crear gráficos de barras, gráficos de puntos (lolipops), diagramas de caja, gráficos de líneas temporales y otros tipos de gráficos utilizando la biblioteca ggplot2 en R.
  4. Comprender y aplicar la técnica de Mosaicplot y la prueba de Chi-Cuadrado para analizar la relación entre variables categóricas en los datos.
  5. Realizar análisis de correspondencias múltiples para explorar relaciones y patrones en datos multivariados.
  6. Comprender y aplicar el concepto de árboles de decisión como una técnica para la toma de decisiones basada en datos.
  7. Crear mapas de calor (heatmap) para visualizar patrones en datos multivariados, especialmente útil en el análisis de datos geoespaciales.
  8. Preparar y depurar datos antes del análisis: aplicar transformaciones numéricas (logarítmica, z‑score), evaluar la normalidad con pruebas (Shapiro‑Wilk, Kolmogorov‑Smirnov) e identificar y gestionar valores atípicos.
  9. Producir visualizaciones avanzadas más allá de los gráficos básicos de ggplot2, combinando raincloud plots (ggdist), composición con patchwork, paletas accesibles (viridis) y representación de efectos marginales con ggeffects.
  10. Ajustar e interpretar modelos de regresión logística binaria (glm), multinomial (nnet::multinom) para analizar variables dependientes categóricas, leyendo coeficientes, odds ratios, medidas de ajuste y predicciones.

Construir e interpretar modelos lineales y logísticos de efectos mixtos (lme4::lmer y lme4::glmer) incorporando efectos aleatorios por hablante, distinguiendo efectos fijos y aleatorios, comparando modelos y comunicando los resultados mediante tablas y gráficos adecuados.

Criterios y procedimiento de evaluación de la actividad

Los contenidos se evaluarán a través de la asistencia y las prácticas realizadas en el aula, así como de la realización de un breve cuestionario online a la finalización del curso. En este cuestionario se preguntará sobre los ejemplos prácticos expuestos en clase.

Asistencia al 85% de la duración del curso

Consultar normativa:

normativa del SFPIE

Inscripción