CONTRASTE DE INDEPENDENCIA
ir a contrastes no paramétricos
A través de este contraste pretendemos probar si existe independencia entre dos variables o atributos (en el conjunto de la población) a partir de las observaciones de las dos característica (en una muestra).Se trata, en realidad, de un caso particular del contraste de adherencia a un ajuste, en el que el modelo teórico sujeto a contraste es el de una distribución bidimensional con variables independientes.
Las frecuencias observadas las podemos disponer en una tabla de contingencia:
X\Y |
y1 |
y2 |
yj |
ym |
|
x1 |
n1,1 |
n1,2 |
· |
· |
n1,* |
x2 |
n2,1 |
n2,2 |
· |
· |
n2,* |
xi |
· |
· |
ni,j |
· |
ni,* |
· |
· |
· |
· |
· |
|
xn |
· |
· |
· |
nn,m |
nn,* |
n*,1 |
n*,2 |
n*,j |
n*,m |
N |
Donde : ni,j es la frecuencia conjunta
ni,* es la frecuencia marginal de x
n*,j es la frecuencia marginal de y
Si la hipótesis de independencia se cumple, y por el teorema de caracterización , se deberá cumplir que todas las frecuencias relativas conjuntas sean iguales al producto de las respectivas frecuencias relativas marginales:
luego en el caso de independencia cada una de las ij frecuencias
conjuntas teóricas serán :
si establecemos el mismo método del test de la chi-2 crearemos el
estadístico
hay que puntualizar que el citado estadístico se distribuirá con una distribución c 2 con (m-1)(n-1) grados de libertad.
Las frecuencias conjuntas debe verificar siempre :
para cada fila
para cada columna
pero además :
una de las m + n ecuaciones anteriores será combinación lineal de las otras m+n-1.
De manera que de los m.n sumandos que constituyen el estadístico
(m.n celdas de la tabla) ,m+n-1 están determinados por los demás y quedan por lo tanto:
m·n -(m+n-1) libres = m·n - m - n + 1 = (m-1).(n-1).
Como no estima ningún parámetro el número de grados de libertad será el número de
sumandos (variables) libres (independientes): por tanto el estadístico seguirá ir a ejemplo