| Sessió | Data i hora d'inici | Data i hora de finalització | Aula | Ubicació |
|---|---|---|---|---|
| 1 | 29/05/2026 09:30 | 29/05/2026 13:30 | Aula 1.2 SFPIE | Servei de Formació Permanent i Innovació Educativa (SFPIE) |
| 2 | 05/06/2026 09:30 | 05/06/2026 13:30 | Aula 1.2 SFPIE | Servei de Formació Permanent i Innovació Educativa (SFPIE) |
| 3 | 09/06/2026 09:30 | 09/06/2026 13:30 | Aula 1.2 SFPIE | Servei de Formació Permanent i Innovació Educativa (SFPIE) |
| 4 | 10/06/2026 09:30 | 10/06/2026 12:30 | Aula 1.2 SFPIE | Servei de Formació Permanent i Innovació Educativa (SFPIE) |
- Cabedo Nebot, Adrian
- PDI-Catedratic/a d'Universitat
• Adquirir habilitats avançades en el maneig de bases de dades lingüístiques més enllà dels fulls de càlcul tradicionals com Excel o Google Sheets.
• Familiaritzar-se amb el programa R, aprenent els conceptes bàsics de programació i anàlisi de dades en este entorn.
• Desenrotllar la capacitat de representar dades de manera efectiva utilitzant tècniques de visualització avançades, incloent-hi barres, lolipops, diagrames de caixa i línies temporals utilitzant GGplot2 en R.
• Adquirir habilitats avançades en l'anàlisi de dades, utilitzant diverses tècniques estadístiques i de visualització, com Mosaicplot i proves de chi quadrat per a explorar relacions entre variables categòriques, anàlisis de correspondències múltiples per a identificar patrons en dades multidimensionals, la construcció d'arbres de decisions per a prendre decisions basades en dades i l'exploració de relacions no lineals, així com la generació de mapes de calor per a visualitzar patrons de correlació i tendències en dades numèriques.
• Dominar les estratègies prèvies a l'anàlisi inferencial: transformació de variables (logarítmica, z-score), avaluació de la normalitat mitjançant proves (Shapiro‑Wilk, Kolmogorov‑Smirnov) i detecció i tractament de valors atípics.
• Aplicar models de regressió logística (binària i multinomial) per a predir i explicar variables dependents categòriques a partir de predictors lingüístics, socials o contextuals, interpretant correctament coeficients, oportunitats ràtios i significació estadística.
• Ajustar i interpretar models lineals i logístics d'efectes mixtos (paquets lme4 i lmerTest) per a modelar correctament la variabilitat associada a parlants en dades lingüístiques, distingint entre efectes fixos i aleatoris i valorant l'ajust del model.
• Anàlisi i explotació d'una base de dades lingüística: més enllà d'Excel/Goole Sheets
• Introducció bàsica al maneig del programa R
• Preparació i transformació de les dades
o Neteja i reestructuració de dades amb dplyr i tidyr (pivot_longer, pivot_wider, mutate, filter, group_by)
o Transformacions numèriques: logaritme, z-score, escalat
o Avaluació de la normalitat: Shapiro‑Wilk, Kolmogorov‑Smirnov.
o Detecció i gestió de valors atípics
• Tècniques estadístiques de visualització i contrast poblacional
o Visualització descriptiva (barres, lolipops, diagrames de caixa, línies temporals…) amb GGplot2.
o Visualització avançada: raincloud plots (ggdist), composició de gràfics amb patchwork, paletes accessibles (viridis, colorblindr) i visualització d'efectes marginals amb ggeffects
o Mosaicplot i chi quadrat
o Anàlisi múltiple de correspondències
o Arbres de decisions
o Mapes de calor
• Regressió logística per a variables dependents categòriques
o Regressió logística binària amb glm(): ajust, interpretació de coeficients i oportunitats ràtios
o Regressió logística multinomial (nnet::multinom) per a variables amb 3 o més nivells
o Diagnòstic i avaluació del model: pseudo‑R², matriu de confusió, corbes ROC i visualització de prediccions amb ggeffects
• Models d'efectes mixtos aplicats a dades lingüístiques
o Fonaments: efectes fixos vs. aleatoris; intercepts; estructura jeràrquica de les dades
o Models lineals mixtos (lme4::lmer) per a variables contínues (F0, duració, intensitat…) amb efectes aleatoris per parlant
o Models logístics mixtos (lme4::glmer) per a variables dependents binàries
o Obtenció de valors p (lmerTest), comparació de models (anova, AIC/BIC) i grandàries d'efecte (r2)
o Comunicació de resultats: informe d'efectes aleatoris
En este curs, utilitzarem dades lingüístiques, específicament dades pragmàtiques i fòniques, com a exemples pràctics per a aprendre a treballar amb R i desenrotllar habilitats estadístiques avançades. No obstant això, és important comprendre que l'enfocament principal d'este curs va més enllà de les dades lingüístiques en si. Les tècniques i proves que aprendran ací són universals i es poden aplicar a una àmplia gamma de dades en diferents camps i disciplines. El nostre objectiu és capacitar als qui assistisquen perquè es convertisquen en analistes de dades competents i versàtils que puguen abordar i resoldre problemes utilitzant R i tècniques estadístiques, independentment del tipus de dades amb el qual treballen en el futur.
En finalitzar el curs els estudiants han de ser capaços de:
1. Comprendre i explorar una base de dades més enllà de les capacitats bàsiques de ferramentes com Excel o Google Sheets. Això implica habilitats per a manipular dades, identificar patrons i realitzar anàlisis descriptives.
2. Aplicar habilitats bàsiques en el maneig del programa R, incloent-hi la capacitat per a importar dades, realitzar operacions de neteja i transformació de dades, i executar anàlisis estadístiques i visualitzacions utilitzant paquets i funcions en R.
3. Crear gràfics de barres, gràfics de punts (lolipops), diagrames de caixa, gràfics de línies temporals i altres tipus de gràfics utilitzant la biblioteca ggplot2 en R.
4. Comprendre i aplicar la tècnica de Mosaicplot i la prova de Chi-Quadrat per a analitzar la relació entre variables categòriques en les dades.
5. Realitzar anàlisi de correspondències múltiples per a explorar relacions i patrons en dades multivariades.
6. Comprendre i aplicar el concepte d'arbres de decisió com una tècnica per a la presa de decisions basada en dades.
7. Crear mapes de calor (heatmap) per a visualitzar patrons en dades multivariades, especialment útil en l'anàlisi de dades geoespacials.
8. Preparar i depurar dades abans de l'anàlisi: aplicar transformacions numèriques (logarítmica, z‑score), avaluar la normalitat amb proves (Shapiro‑Wilk, Kolmogorov‑Smirnov) i identificar i gestionar valors atípics.
9. Produir visualitzacions avançades més enllà dels gràfics bàsics de ggplot2, combinant raincloud plots (ggdist), composició amb patchwork, paletes accessibles (viridis) i representació d'efectes marginals amb ggeffects.
10. Ajustar i interpretar models de regressió logística binària (glm), multinomial (nnet::multinom) per a analitzar variables dependents categòriques, llegint coeficients, oportunitats ràtios, mesures d'ajust i prediccions.
11. Construir i interpretar models lineals i logístics d'efectes mixtos (lme4::lmer i lme4::glmer) incorporant efectes aleatoris per parlant, distingint efectes fixos i aleatoris, comparant models i comunicant els resultats mitjançant taules i gràfics adequats.
Els continguts s'avaluaran a través de l'assistència i les pràctiques realitzades a l'aula, així com de la realització d'un breu qüestionari en línia a la finalització del curs. En este qüestionari es preguntarà sobre els exemples pràctics exposats en classe.
Assistència al 85% de la duració del curs
Consultar normativa:












