UVdocènciaUniversitat de València Logo del portal

Tècniques estadístiques de visualització i validesa poblacional amb R mitjançant “dades pragmàtiques i fòniques”

Destinataris PDI
Modalitat d'impartició Presencial
Llengua Castellà
Durada total 15
Durada presencial 15
Programa Convocatòria 'Docència i investigació'
Modalitat formativa Curs
Curs acadèmic 2024-2025
Edició 01
Any del pla de formació 2024
Data d'inici del curs 20/05/2024
Data de finalització del curs 30/05/2024
Data d'inici d'inscripció 25/03/2024
Data de finalització d'inscripció 12/04/2024
Sessions
Sessió Data i hora d'inici Data i hora de finalització Aula Ubicació
1 20/05/2024 09:30 20/05/2024 13:30 Aula 2.1 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
2 23/05/2024 09:30 23/05/2024 13:30 Aula 2.1 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
3 27/05/2024 09:30 27/05/2024 13:30 Aula 2.1 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
4 30/05/2024 09:30 30/05/2024 12:30 Aula 2.1 SFPIE Servei de Formació Permanent i Innovació Educativa (SFPIE)
Professorat UV
  • Cabedo Nebot, Adrian
  • PDI-Titular d'Universitat
Ver ficha
Objectius formatius

•    Adquirir habilitats avançades en el maneig de bases de dades lingüístiques més enllà dels fulls de càlcul tradicionals com Excel o Google Sheets.
•    Familiaritzar-se amb el programa R, aprenent els conceptes bàsics de programació i anàlisi de dades en este entorn.
•    Desenvolupar la capacitat de representar dades de manera efectiva utilitzant tècniques de visualització avançades, incloent-hi barres, lolipops, diagrames de caixa i línies temporals utilitzant GGplot2 en R.
•    Adquirir habilitats avançades en l'anàlisi de dades, utilitzant diverses tècniques estadístiques i de visualització, com Mosaicplot i proves de chi quadrat per a explorar relacions entre variables categòriques, anàlisis de correspondències múltiples i anàlisis de components per a identificar patrons en dades multidimensionals, la construcció d'arbres de decisions per a prendre decisions basades en dades i l'exploració de relacions no lineals, així com la generació de mapes de calor per a visualitzar patrons de correlació i tendències en dades numèriques.
 

Continguts

•    Anàlisi i explotació d'una base de dades lingüística: més enllà d'Excel/Goole Sheets
•    Introducció bàsica al maneig del programa R
•    Tècniques estadístiques de visualització i contrast poblacional
o    Visualització descriptiva (barres, lolipops, diagrames de caixa, línies temporals…) amb GGplot2.
o    Mosaicplot i chi quadrat
o    Anàlisi múltiple de correspondències / Anàlisis de components
o    Arbres de decisions
o    Mapes de calor 
 

Resum del curs

El curs oferix una immersió completa en l'anàlisi i aprofitament de bases de dades lingüístiques, superant les limitacions d'eines convencionals com Excel i Google Sheets. Els participants adquiriran una sòlida comprensió de R, un llenguatge de programació essencial en anàlisi de dades. A més, exploraran tècniques estadístiques avançades per a visualitzar i analitzar dades lingüístiques i poblacionals. Aprendran a crear visualitzacions descriptives impactants utilitzant GGplot2, aplicaran Mosaicplot i proves de chi quadrat per a investigar relacions categòriques, identificaran patrons en dades multidimensionals mitjançant anàlisis de correspondències i components, utilitzaran arbres de decisions per a prendre decisions basades en dades i exploraran relacions no lineals, i generaran mapes de calor per a visualitzar correlacions i tendències en dades numèriques. Este curs proporciona una base per a l'anàlisi avançada de dades lingüístiques i poblacionals.


Objectius específics
•    Adquirir habilitats avançades en el maneig de bases de dades lingüístiques més enllà dels fulls de càlcul tradicionals com Excel o Google Sheets.
•    Familiaritzar-se amb el programa R, aprenent els conceptes bàsics de programació i anàlisi de dades en este entorn.
•    Desenvolupar la capacitat de representar dades de manera efectiva utilitzant tècniques de visualització avançades, incloent-hi barres, lolipops, diagrames de caixa i línies temporals utilitzant GGplot2 en R.
•    Adquirir habilitats avançades en l'anàlisi de dades, utilitzant diverses tècniques estadístiques i de visualització, com Mosaicplot i proves de chi quadrat per a explorar relacions entre variables categòriques, anàlisis de correspondències múltiples i anàlisis de components per a identificar patrons en dades multidimensionals, la construcció d'arbres de decisions per a prendre decisions basades en dades i l'exploració de relacions no lineals, així com la generació de mapes de calor per a visualitzar patrons de correlació i tendències en dades numèriques.

CONTINGUDES
•    Anàlisis i explotació d'una base de dades lingüística: més enllà d'Excel/Goole Sheets
•    Introducció bàsica al maneig del programa R
•    Tècniques estadístiques de visualització i contrast poblacional
o    Visualització descriptiva (barres, lolipops, diagrames de caixa, línies temporals…) amb GGplot2.
o    Mosaicplot i chi quadrat
o    Anàlisi múltiple de correspondències / Anàlisis de components
o    Arbres de decisions
o    Mapes de calor 
CONEIXEMENTS PREVIS
Es recomana a les persones interessades a realitzar el curs que tinguen un coneixement bàsic de programes de fulles de dades com, per exemple, Excel o, almenys, que coneguen la seua estructura general. També és recomanable que hagen realitzat investigacions prèvies amb dades.
REQUISITS TÈCNICS
Es recomana a qui acudisca al curs que tinga prèviament instal·lat R (https://cran.rediris.es/) i RStudio (https://posit.co/download/rstudio-desktop) en el seu propi ordinador portàtil, independentment que la realització del curs puga impartir-se en algun aula amb ordinadors. Tots dos són programes gratuïts i poden instal·lar-se en Linux, Windows i Mac.
SOBRE LES DADES LINGÜÍSTIQUES D'EXEMPLIFICACIÓ EN EL CURS
En este curs, utilitzarem dades lingüístiques, específicament dades pragmàtiques i fòniques, com a exemples pràctics per a aprendre a treballar amb R i desenvolupar habilitats estadístiques avançades. No obstant això, és important comprendre que l'enfocament principal d'este curs va més enllà de les dades lingüístiques en si. Les tècniques i proves que aprendran ací són universals i es poden aplicar a una àmplia gamma de dades en diferents camps i disciplines. El nostre objectiu és capacitar als qui assistisquen perquè es convertisquen en analistes de dades competents i versàtils que puguen abordar i resoldre problemes utilitzant R i tècniques estadístiques, independentment del tipus de dades amb el qual treballen en el futur.

Competències que es desenvoluparan

En finalitzar el curs els estudiants han de ser capaços de:
1.    Comprendre i explorar una base de dades més enllà de les capacitats bàsiques d'eines com Excel o Google Sheets. Això implica habilitats per a manipular dades, identificar patrons i realitzar anàlisis descriptives.
2.    Aplicar habilitats bàsiques en el maneig del programa R, incloent-hi la capacitat per a importar dades, realitzar operacions de neteja i transformació de dades, i executar anàlisis estadístiques i visualitzacions utilitzant paquets i funcions en R.
3.    Crear gràfics de barres, gràfics de punts (lolipops), diagrames de caixa, gràfics de línies temporals i altres tipus de gràfics utilitzant la biblioteca ggplot2 en R.
4.    Comprendre i aplicar la tècnica de Mosaicplot i la prova de Chi-Quadrat per a analitzar la relació entre variables categòriques en les dades.
5.    Realitzar anàlisi de correspondències múltiples i anàlisis de components per a explorar relacions i patrons en dades multivariades.
6.    Comprendre i aplicar el concepte d'arbres de decisió com una tècnica per a la presa de decisions basada en dades.
7.    Crear mapes de calor (heatmap) per a visualitzar patrons en dades multivariades, especialment útil en l'anàlisi de dades geoespaciales.
 

Criteris i procediment d'avaluació de l'activitat

Els continguts s'avaluaran a través de l'assistència i les pràctiques realitzades a l'aula, així com de la realització d'un breu qüestionari en línia a la finalització del curs. En este qüestionari es preguntarà sobre els exemples pràctics exposats en classe.
Assistència al 85% de la duració del curs
 

Inscripció