El test U de Wilcoxon

El test U de Wilcoxon, Mann y Whitney para la comparación de dos muestras independientes

Este test debido a Mann y Whitney (1947) y basado en el Wilcoxon para muestras independientes es en cierto modo el equivalente no paramétrico del test t para la comparación de medias de dos distribuciones .Es seguramente una de las pruebas más potentes de entre las no paramétricas.La aplicación de la prueba exige que los datos de ambas muestras vengan medidos, al menos en escala ordinal, y su correcta ejecución requiere que las distribuciones muestrales tengan la misma forma (asimetría y curtósis).

En estas circunstancias, para contrastar si el comportamiento de ambas poblaciones es semejante se contrasta la hipótesis nula de que "la probabilidad de que una observación aleatoria de la primera población supera a una observación aleatoria de la segunda población es 0.5" frente a la alternativa de que está probabilidad es distinta a 0.5 ( pudiendose plantear bilateral o unilateralmente)

La prueba parte de N₁ valores aleatorios de la primera población y de otros N₂ valores aleatorios de la segunda.Por ejemplo:

Poblacion 1	orden	orden	Población 2
16	1	2	12
20	3	5	18
11	4	6	17
15	7

ir a script de realización:

Para llevarla a cabo se ordenan de forma creciente la totalidad de las observaciones en una sola serie especificando la población de origen. Por ejemplo:

Orden	1	2	3	4	5	6	7
Observación	11	12	15	16	17	18	20
Población	1	2	1	1	2	2	1

A partir de aquí se pueden obtener los estadísticos U₁ y U₂ definidos como:

wpeD.jpg (3616 bytes)

Donde N₁ y N₂ son los tamaños muestrales de cada una de las dos muestras y R₁ y R₂la suma de los rangos de cada una de las dos muestras:

En nuestro caso:

R₁= 1+3+4+7= 15

R₂= 2+5+6=13

Con lo que los dos estadísticos quedarían:

U₁ = (4×3) +((4×5)/2))-15=7

U₂ =(3×4)+((3×4)/2))-13=5 U será 5 mirar en TABLA

Finalmente se compara el estadístico U= mínimo de U₁yU₂con el correpondiente valor crítico,U(N₁,N₂,a), tabulado.De forma que fijado un determinado nivel de significación,a si:

U<U(N₁,N₂,a) se aceptará ( no se rechazará) la hipótesis nula, y por lo tanto mantendremos la hipótesis de que las dos muestran provienen de dos poblaciones de comportamiento semejante.
U> U(N₁,N₂,a) rechazaremos la hipótesis nula , y por tanto concluiremos que no se puede mantener la hipótesis de que ambas miestran provenga de poblaciones semejantes.

En nuestro ejemplo el valor crítico para a= 0.10 y un contraste bilateral : U(3,4,0.1)=1 , por lo que no podríamos rechazar la hipótesis nula con ese nivel de significación.

Alternativamente a la comparación con el valor tabulado se puede comparar el valor del estadístico con la siguiente aproximación válida para tamaños muestrales grandes ( N₁+N₂ >60 ):

wpe3.jpg (9100 bytes)

Cuando no se pueda o no se quiera fijar de antemano un nivel de significación, o bien cuando no se disponga de valores tabulados para U(N₁,N₂,a) se puede obtener el nivel de significación asociado ( de una o dos colas) a partir de la siguiente aproximación ( válida para N₁> 8 , N₂> 8)

wpe4.jpg (3227 bytes)

Mann y Whitney (1947):"On a test of wether one of two random variables is stochastically largers than the other" Ann.Math.Statis., 22,125-128
Potencia del Test U de Mann y Whitney: Aplicado sobre un caso que cumpla las condiciones de aplicación del test t ( normalidad e independencia de las dos muestras) alcanza un 95% de la potencia del test parámetrico.
Las tablas de los valores críticos para distintas combinaciones de tamaños muestrales se deben a R.C. Milton: Milton,R.C.(1964): " An extendent table of critical value for the Mann-Whitney two-sample statistic" Journal of American Statistical Society, 59,925-934 (1964)