UVdocènciaUniversitat de València Logo del portal

TÈCNIQUES ESTADÍSTIQUES DE VISUALITZACIÓ I VALIDESA POBLACIONAL AMB R MITJANÇANT “DADES PRAGMÀTIQUES I FÒNIQUES

Destinataris PDI, PIF
Modalitat d'impartició Presencial
Llengua Castellà
Durada total 15
Durada presencial 15
Programa Convocatòria 'Docència i investigació'
Modalitat formativa Curs
Curs acadèmic 2025-2026
Edició 01
Any del pla de formació 2026
Data d'inici del curs 29/05/2026
Data de finalització del curs 10/06/2026
Data d'inici d'inscripció 05/05/2026
Data de finalització d'inscripció 12/05/2026
Sessions
Sessió Data i hora d'inici Data i hora de finalització Aula Ubicació
1 29/05/2026 09:30 29/05/2026 13:30 Aula 1.2 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
2 05/06/2026 09:30 05/06/2026 13:30 Aula 1.2 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
3 09/06/2026 09:30 09/06/2026 13:30 Aula 1.2 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
4 10/06/2026 09:30 10/06/2026 12:30 Aula 1.2 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
Professorat UV
  • Cabedo Nebot, Adrian
  • PDI-Catedratic/a d'Universitat
Ver ficha
Objectius formatius

•    Adquirir habilitats avançades en el maneig de bases de dades lingüístiques més enllà dels fulls de càlcul tradicionals com Excel o Google Sheets.
•    Familiaritzar-se amb el programa R, aprenent els conceptes bàsics de programació i anàlisi de dades en este entorn.
•    Desenrotllar la capacitat de representar dades de manera efectiva utilitzant tècniques de visualització avançades, incloent-hi barres, lolipops, diagrames de caixa i línies temporals utilitzant GGplot2 en R.
•    Adquirir habilitats avançades en l'anàlisi de dades, utilitzant diverses tècniques estadístiques i de visualització, com Mosaicplot i proves de chi quadrat per a explorar relacions entre variables categòriques, anàlisis de correspondències múltiples per a identificar patrons en dades multidimensionals, la construcció d'arbres de decisions per a prendre decisions basades en dades i l'exploració de relacions no lineals, així com la generació de mapes de calor per a visualitzar patrons de correlació i tendències en dades numèriques.
•    Dominar les estratègies prèvies a l'anàlisi inferencial: transformació de variables (logarítmica, z-score), avaluació de la normalitat mitjançant proves (Shapiro‑Wilk, Kolmogorov‑Smirnov) i detecció i tractament de valors atípics.
•    Aplicar models de regressió logística (binària i multinomial) per a predir i explicar variables dependents categòriques a partir de predictors lingüístics, socials o contextuals, interpretant correctament coeficients, oportunitats ràtios i significació estadística.
•    Ajustar i interpretar models lineals i logístics d'efectes mixtos (paquets lme4 i lmerTest) per a modelar correctament la variabilitat associada a parlants en dades lingüístiques, distingint entre efectes fixos i aleatoris i valorant l'ajust del model.
 

Continguts

•    Anàlisi i explotació d'una base de dades lingüística: més enllà d'Excel/Goole Sheets
•    Introducció bàsica al maneig del programa R
•    Preparació i transformació de les dades
o    Neteja i reestructuració de dades amb dplyr i tidyr (pivot_longer, pivot_wider, mutate, filter, group_by)
o    Transformacions numèriques: logaritme, z-score, escalat
o    Avaluació de la normalitat: Shapiro‑Wilk, Kolmogorov‑Smirnov.
o    Detecció i gestió de valors atípics
•    Tècniques estadístiques de visualització i contrast poblacional
o    Visualització descriptiva (barres, lolipops, diagrames de caixa, línies temporals…) amb GGplot2.
o    Visualització avançada: raincloud plots (ggdist), composició de gràfics amb patchwork, paletes accessibles (viridis, colorblindr) i visualització d'efectes marginals amb ggeffects
o    Mosaicplot i chi quadrat
o    Anàlisi múltiple de correspondències 
o    Arbres de decisions
o    Mapes de calor 
•    Regressió logística per a variables dependents categòriques
o    Regressió logística binària amb glm(): ajust, interpretació de coeficients i oportunitats ràtios
o    Regressió logística multinomial (nnet::multinom) per a variables amb 3 o més nivells
o    Diagnòstic i avaluació del model: pseudo‑R², matriu de confusió, corbes ROC i visualització de prediccions amb ggeffects 
•    Models d'efectes mixtos aplicats a dades lingüístiques
o    Fonaments: efectes fixos vs. aleatoris; intercepts; estructura jeràrquica de les dades
o    Models lineals mixtos (lme4::lmer) per a variables contínues (F0, duració, intensitat…) amb efectes aleatoris per parlant 
o    Models logístics mixtos (lme4::glmer) per a variables dependents binàries
o    Obtenció de valors p (lmerTest), comparació de models (anova, AIC/BIC) i grandàries d'efecte (r2)
o    Comunicació de resultats: informe d'efectes aleatoris
 

Competències que es desenvoluparan

En este curs, utilitzarem dades lingüístiques, específicament dades pragmàtiques i fòniques, com a exemples pràctics per a aprendre a treballar amb R i desenrotllar habilitats estadístiques avançades. No obstant això, és important comprendre que l'enfocament principal d'este curs va més enllà de les dades lingüístiques en si. Les tècniques i proves que aprendran ací són universals i es poden aplicar a una àmplia gamma de dades en diferents camps i disciplines. El nostre objectiu és capacitar als qui assistisquen perquè es convertisquen en analistes de dades competents i versàtils que puguen abordar i resoldre problemes utilitzant R i tècniques estadístiques, independentment del tipus de dades amb el qual treballen en el futur.

En finalitzar el curs els estudiants han de ser capaços de:
1.    Comprendre i explorar una base de dades més enllà de les capacitats bàsiques de ferramentes com Excel o Google Sheets. Això implica habilitats per a manipular dades, identificar patrons i realitzar anàlisis descriptives.
2.    Aplicar habilitats bàsiques en el maneig del programa R, incloent-hi la capacitat per a importar dades, realitzar operacions de neteja i transformació de dades, i executar anàlisis estadístiques i visualitzacions utilitzant paquets i funcions en R.
3.    Crear gràfics de barres, gràfics de punts (lolipops), diagrames de caixa, gràfics de línies temporals i altres tipus de gràfics utilitzant la biblioteca ggplot2 en R.
4.    Comprendre i aplicar la tècnica de Mosaicplot i la prova de Chi-Quadrat per a analitzar la relació entre variables categòriques en les dades.
5.    Realitzar anàlisi de correspondències múltiples per a explorar relacions i patrons en dades multivariades.
6.    Comprendre i aplicar el concepte d'arbres de decisió com una tècnica per a la presa de decisions basada en dades.
7.    Crear mapes de calor (heatmap) per a visualitzar patrons en dades multivariades, especialment útil en l'anàlisi de dades geoespacials.
8.    Preparar i depurar dades abans de l'anàlisi: aplicar transformacions numèriques (logarítmica, z‑score), avaluar la normalitat amb proves (Shapiro‑Wilk, Kolmogorov‑Smirnov) i identificar i gestionar valors atípics.
9.    Produir visualitzacions avançades més enllà dels gràfics bàsics de ggplot2, combinant raincloud plots (ggdist), composició amb patchwork, paletes accessibles (viridis) i representació d'efectes marginals amb ggeffects.
10.    Ajustar i interpretar models de regressió logística binària (glm), multinomial (nnet::multinom) per a analitzar variables dependents categòriques, llegint coeficients, oportunitats ràtios, mesures d'ajust i prediccions.
11.    Construir i interpretar models lineals i logístics d'efectes mixtos (lme4::lmer i lme4::glmer) incorporant efectes aleatoris per parlant, distingint efectes fixos i aleatoris, comparant models i comunicant els resultats mitjançant taules i gràfics adequats.
 

Criteris i procediment d'avaluació de l'activitat

Els continguts s'avaluaran a través de l'assistència i les pràctiques realitzades a l'aula, així com de la realització d'un breu qüestionari en línia a la finalització del curs. En este qüestionari es preguntarà sobre els exemples pràctics exposats en classe.
Assistència al 85% de la duració del curs

Consultar normativa:

normativa del SFPIE

Inscripció