|
|
|
Anàlisi de la dispersió respecte a la mitjana de la distribució de la variable X3 Edat en anys de la taula
edat | A | P | carnet | ||
1 |
D |
22 |
162 |
63 |
N |
2 |
D |
24 |
174 |
64 |
N |
3 |
H |
23 |
179 |
73 |
S |
4 |
D |
25 |
166 |
76 |
S |
5 |
H |
22 |
181 |
89 |
N |
6 |
H |
23 |
170 |
72 |
S |
7 |
D |
22 |
172 |
68 |
N |
8 |
H |
23 |
168 |
70 |
S |
9 |
H |
23 |
175 |
81 |
N |
10 |
D |
24 |
170 |
69 |
N |
Podem ampliar la taula que hem fet servir per al càlcul de la
mitjana incloent-hi les desviacions respecte a la mitjana, els quadrats de les
mateixes i aquestos ponderats per les respectives freqüències. En la taula que
segueix hem exposat els càlculs emprant tant les freqüències absolutes com les
relatives. Es tracta òbviament d’una redundància, que ens hem permès amb una
finalitat merament il·lustrativa. Les columnes última i penúltima de la taula
cal considerar-les doncs com alternatives. Recordem que el valor de la mitjana
és
xi |
ni |
fi |
xi – m |
(xi – m)2 |
(xi – m)2ni |
(xi – m)2fi |
22 |
3 |
0.3 |
–1.1 |
1.21 |
3.63 |
0.363 |
23 |
4 |
0.4 |
–0.1 |
0.01 |
0.04 |
0.004 |
24 |
2 |
0.2 |
0.9 |
0.81 |
1.62 |
0.162 |
25 |
1 |
0.1 |
1.9 |
3.61 |
3.61 |
0.361 |
S |
10 |
1 |
|
|
8.9 |
s2 = 0.89 |
|
|
|
|
|
s2 = 0.89 |
|
Altra opció consisteix a desenvolupar la taula sense necessitat de calcular les desviacions i obtenir la variància a partir de l’expressió alternativa
xi |
ni |
fi |
xi2 |
xi2fi |
22 |
3 |
0.3 |
484 |
145.2 |
23 |
4 |
0.4 |
529 |
211.6 |
24 |
2 |
0.2 |
576 |
115.2 |
25 |
1 |
0.1 |
625 |
62.5 |
S |
10 |
1 |
|
534.5 |
|
|
|
|
|
La variància serà
Si volem expressar la dispersió en les unitats originals de la variable, en anys, podem calcular la desviació típica, obtenint l’arrel quadrat de la variància,
Aquesta manera de presentar la dispersió pot ser siga més intuïtiva i facilite la interpretació: aquesta distribució presenta una dispersió d’aproximadament un any en torn a una mitjana de 23. Si tornem a mirar les dades veurem que la informació sintetitzada en aquestos dos paràmetres caracteritza amb una fidelitat acceptable el patró de distribució de les edats, en la població analitzada.
Si volguérem reflectir la relació entre dispersió i valor de la mitjana en un únic paràmetre, cosa especialment útil a l’hora d’establir comparacions entre distribucions, hauríem de calcular el coeficient de variació de Pearson nx,
Es pot comprovar com aquest mateix paràmetre augmenta sensiblement en el cas del exemple 2.7 on apareixia un valor atípic,
evidenciant la pèrdua relativa de representativitat de la mitjana.