University of Valencia logo Logo Permanent Training and Educational Innovation Service (SFPIE) Logo del portal

Tècniques estadístiques de visualització i validesa poblacional amb R mitjançant “dades pragmàtiques i fòniques”

Target PDI
Method of impartition Presential
Language Spanish
Total duration 15
Presential duration 15
Program Call 'Training and research'
Training modality Course
Academic course 2024-2025
Edition 01
Training plan year 2024
Start date of the course 20/05/2024
End date of the course 30/05/2024
Registration start date 25/03/2024
Registration end date 12/04/2024
Sessions
Session Start date and time End date and time Aula Location
1 20/05/2024 09:30 20/05/2024 13:30 Aula 2.1 SFPIE Lifelong Learning and Educational Innovation Service (SFPIE)
2 23/05/2024 09:30 23/05/2024 13:30 Aula 2.1 SFPIE Lifelong Learning and Educational Innovation Service (SFPIE)
3 27/05/2024 09:30 27/05/2024 13:30 Aula 2.1 SFPIE Lifelong Learning and Educational Innovation Service (SFPIE)
4 30/05/2024 09:30 30/05/2024 12:30 Aula 2.1 SFPIE Lifelong Learning and Educational Innovation Service (SFPIE)
UV Faculty
  • Cabedo Nebot, Adrian
  • PDI-Titular d'Universitat
Ver ficha
Training objectives

•    Adquirir habilitats avançades en el maneig de bases de dades lingüístiques més enllà dels fulls de càlcul tradicionals com Excel o Google Sheets.
•    Familiaritzar-se amb el programa R, aprenent els conceptes bàsics de programació i anàlisi de dades en este entorn.
•    Desenvolupar la capacitat de representar dades de manera efectiva utilitzant tècniques de visualització avançades, incloent-hi barres, lolipops, diagrames de caixa i línies temporals utilitzant GGplot2 en R.
•    Adquirir habilitats avançades en l'anàlisi de dades, utilitzant diverses tècniques estadístiques i de visualització, com Mosaicplot i proves de chi quadrat per a explorar relacions entre variables categòriques, anàlisis de correspondències múltiples i anàlisis de components per a identificar patrons en dades multidimensionals, la construcció d'arbres de decisions per a prendre decisions basades en dades i l'exploració de relacions no lineals, així com la generació de mapes de calor per a visualitzar patrons de correlació i tendències en dades numèriques.
 

Contents

•    Anàlisi i explotació d'una base de dades lingüística: més enllà d'Excel/Goole Sheets
•    Introducció bàsica al maneig del programa R
•    Tècniques estadístiques de visualització i contrast poblacional
o    Visualització descriptiva (barres, lolipops, diagrames de caixa, línies temporals…) amb GGplot2.
o    Mosaicplot i chi quadrat
o    Anàlisi múltiple de correspondències / Anàlisis de components
o    Arbres de decisions
o    Mapes de calor 
 

Resum del curs

El curs oferix una immersió completa en l'anàlisi i aprofitament de bases de dades lingüístiques, superant les limitacions d'eines convencionals com Excel i Google Sheets. Els participants adquiriran una sòlida comprensió de R, un llenguatge de programació essencial en anàlisi de dades. A més, exploraran tècniques estadístiques avançades per a visualitzar i analitzar dades lingüístiques i poblacionals. Aprendran a crear visualitzacions descriptives impactants utilitzant GGplot2, aplicaran Mosaicplot i proves de chi quadrat per a investigar relacions categòriques, identificaran patrons en dades multidimensionals mitjançant anàlisis de correspondències i components, utilitzaran arbres de decisions per a prendre decisions basades en dades i exploraran relacions no lineals, i generaran mapes de calor per a visualitzar correlacions i tendències en dades numèriques. Este curs proporciona una base per a l'anàlisi avançada de dades lingüístiques i poblacionals.


Objectius específics
•    Adquirir habilitats avançades en el maneig de bases de dades lingüístiques més enllà dels fulls de càlcul tradicionals com Excel o Google Sheets.
•    Familiaritzar-se amb el programa R, aprenent els conceptes bàsics de programació i anàlisi de dades en este entorn.
•    Desenvolupar la capacitat de representar dades de manera efectiva utilitzant tècniques de visualització avançades, incloent-hi barres, lolipops, diagrames de caixa i línies temporals utilitzant GGplot2 en R.
•    Adquirir habilitats avançades en l'anàlisi de dades, utilitzant diverses tècniques estadístiques i de visualització, com Mosaicplot i proves de chi quadrat per a explorar relacions entre variables categòriques, anàlisis de correspondències múltiples i anàlisis de components per a identificar patrons en dades multidimensionals, la construcció d'arbres de decisions per a prendre decisions basades en dades i l'exploració de relacions no lineals, així com la generació de mapes de calor per a visualitzar patrons de correlació i tendències en dades numèriques.

CONTINGUDES
•    Anàlisis i explotació d'una base de dades lingüística: més enllà d'Excel/Goole Sheets
•    Introducció bàsica al maneig del programa R
•    Tècniques estadístiques de visualització i contrast poblacional
o    Visualització descriptiva (barres, lolipops, diagrames de caixa, línies temporals…) amb GGplot2.
o    Mosaicplot i chi quadrat
o    Anàlisi múltiple de correspondències / Anàlisis de components
o    Arbres de decisions
o    Mapes de calor 
CONEIXEMENTS PREVIS
Es recomana a les persones interessades a realitzar el curs que tinguen un coneixement bàsic de programes de fulles de dades com, per exemple, Excel o, almenys, que coneguen la seua estructura general. També és recomanable que hagen realitzat investigacions prèvies amb dades.
REQUISITS TÈCNICS
Es recomana a qui acudisca al curs que tinga prèviament instal·lat R (https://cran.rediris.es/) i RStudio (https://posit.co/download/rstudio-desktop) en el seu propi ordinador portàtil, independentment que la realització del curs puga impartir-se en algun aula amb ordinadors. Tots dos són programes gratuïts i poden instal·lar-se en Linux, Windows i Mac.
SOBRE LES DADES LINGÜÍSTIQUES D'EXEMPLIFICACIÓ EN EL CURS
En este curs, utilitzarem dades lingüístiques, específicament dades pragmàtiques i fòniques, com a exemples pràctics per a aprendre a treballar amb R i desenvolupar habilitats estadístiques avançades. No obstant això, és important comprendre que l'enfocament principal d'este curs va més enllà de les dades lingüístiques en si. Les tècniques i proves que aprendran ací són universals i es poden aplicar a una àmplia gamma de dades en diferents camps i disciplines. El nostre objectiu és capacitar als qui assistisquen perquè es convertisquen en analistes de dades competents i versàtils que puguen abordar i resoldre problemes utilitzant R i tècniques estadístiques, independentment del tipus de dades amb el qual treballen en el futur.

Competencies to be developed

En finalitzar el curs els estudiants han de ser capaços de:
1.    Comprendre i explorar una base de dades més enllà de les capacitats bàsiques d'eines com Excel o Google Sheets. Això implica habilitats per a manipular dades, identificar patrons i realitzar anàlisis descriptives.
2.    Aplicar habilitats bàsiques en el maneig del programa R, incloent-hi la capacitat per a importar dades, realitzar operacions de neteja i transformació de dades, i executar anàlisis estadístiques i visualitzacions utilitzant paquets i funcions en R.
3.    Crear gràfics de barres, gràfics de punts (lolipops), diagrames de caixa, gràfics de línies temporals i altres tipus de gràfics utilitzant la biblioteca ggplot2 en R.
4.    Comprendre i aplicar la tècnica de Mosaicplot i la prova de Chi-Quadrat per a analitzar la relació entre variables categòriques en les dades.
5.    Realitzar anàlisi de correspondències múltiples i anàlisis de components per a explorar relacions i patrons en dades multivariades.
6.    Comprendre i aplicar el concepte d'arbres de decisió com una tècnica per a la presa de decisions basada en dades.
7.    Crear mapes de calor (heatmap) per a visualitzar patrons en dades multivariades, especialment útil en l'anàlisi de dades geoespaciales.
 

Criteria and procedure for evaluation of the activity

Els continguts s'avaluaran a través de l'assistència i les pràctiques realitzades a l'aula, així com de la realització d'un breu qüestionari en línia a la finalització del curs. En este qüestionari es preguntarà sobre els exemples pràctics exposats en classe.
Assistència al 85% de la duració del curs
 

Inscription