1. Introducció

Models

Una de les raons per la qual interessen les tècniques descriptives és la capacitat d'aquestes per a representar les dades originals. Hem vist que ho fan quantificant característiques que descriuen els grups de dades (tendència central, variabilitat, asimetria i apuntament). Si la representació és fidel, els valors dels estadístics descriptius ens donen molta informació de les dades, però no tota la informació. Per exemple, la mitjana representa la tendència central, però no informa de la variabilitat de les dades.

La representació de les dades es pot millorar si modelitzem les distribucions, és a dir, si les substituïm per un model. En general, un model és una representació de les característiques fonamentals d'un objecte. Models que interessen especialment en psicologia són els que representen relacions entre variables o els que representen distribucions de dades.

Les principals raons per les quals els models són especialment útils són:

a) Faciliten el tractament de l'objecte que representen (relacions entre variables, distribucions, etc.).

b) Són una manera molt compacta/eficient de transmetre informació.

Models de distribucions de variables aleatòries

Considerem les dades següents:

Hem vist que podem representar les dades en tècniques que representen les característiques més importants. Així, podem substituir-les per una gràfica com:

 

La gràfica ens dóna una representació intuïtiva, però no ens informa de manera precisa: hem perdut informació.

Una altra possibilitat consisteix a obtenir estadístics descriptius, per exemple:

Amb la qual cosa tenim informació de la tendència central, la variabilitat, però està clar que hem perdut quasi tota la informació individual.

Els models de distribucions representen de manera compacta i precisa (dins de certs límits) les distribucions de les variables. Per exemple, el model

 

on Mu i Sigma son la mitjana i la desviació típica, respectivament, representa distribucions de dades la forma de les quals és sempre la mateixa:


Si posem la corba anterior damunt l'histograma que representa les dades de l'exemple, podem apreciar que la corba aproxima bastant bé la distribució de les dades:

 

La conclusió és que el model representa (aproximadament) la distribució original i, per tant, ens dóna informació més completa de les dades que si només obtenim estadístics descriptius.

De la mateixa manera que ha estat definit el model de l'exemple, n'han estat definits uns altres, que podem utilitzar per representar les dades si el model s'hi acosta raonablement. En els paràgrafs següents, són introduïts els models de distribució utilitzats més freqüentment.