El test U de Wilcoxon, Mann y Whitney para la comparación de dos muestras independientes

Este test debido a Mann y Whitney (1947) y basado en el Wilcoxon para muestras independientes es en cierto modo el equivalente no paramétrico del test t para la comparación de medias de dos distribuciones .Es seguramente una de las pruebas más potentes de entre las no paramétricas.La aplicación de la prueba exige que los datos de ambas muestras vengan medidos, al menos en escala ordinal, y su correcta ejecución requiere que las distribuciones muestrales tengan la misma forma (asimetría y curtósis).

En estas circunstancias, para contrastar si el comportamiento de ambas poblaciones es semejante se contrasta la hipótesis nula de que "la probabilidad de que una observación aleatoria de la primera población supera a una observación aleatoria de la segunda población es 0.5" frente a la alternativa de que está probabilidad es distinta a 0.5 ( pudiendose plantear bilateral o unilateralmente)

La prueba parte de N1 valores aleatorios de la primera población y de otros N2 valores aleatorios de la segunda.Por ejemplo:

Poblacion 1              orden           orden   Población 2            
16 1

2

12  
20 3 5 18  
11 4 6 17  
15 7      

  ir a script de realización:

Para llevarla a cabo se ordenan de forma creciente la totalidad de las observaciones en una sola serie especificando la población de origen. Por ejemplo:

Orden 1 2 3 4 5 6 7
Observación 11 12 15 16 17 18 20
Población 1 2 1 1 2 2 1

A partir de aquí se pueden obtener los estadísticos U1 y U2 definidos como:

wpeD.jpg (3616 bytes)

Donde N1 y N2  son los tamaños muestrales de cada una de las dos muestras y R1 y R2 la suma de los rangos de cada una de las dos muestras:

En nuestro caso:

R1= 1+3+4+7= 15

R2= 2+5+6=13

Con lo que los dos estadísticos quedarían:

U1 = (4×3) +((4×5)/2))-15=7

U2  =(3×4)+((3×4)/2))-13=5   U será 5 mirar en TABLA

Finalmente se compara el estadístico U= mínimo de U1 y Ucon el correpondiente valor crítico,U(N1,N2,a),   tabulado.De forma que fijado un determinado nivel de significación,a si:

En nuestro ejemplo el valor crítico para a= 0.10 y un contraste bilateral : U(3,4,0.1)=1 , por lo que no podríamos rechazar la hipótesis nula con ese nivel de significación.

Alternativamente a la comparación con el valor tabulado se puede comparar el valor del estadístico con la siguiente aproximación válida para tamaños muestrales grandes ( N1+N2 >60 ):

wpe3.jpg (9100 bytes)

Cuando no se pueda o no se quiera fijar de antemano un nivel de significación, o bien cuando no se disponga de valores tabulados para U(N1,N2,a) se puede obtener el nivel de significación asociado ( de una o dos colas) a partir de la siguiente aproximación ( válida para N1> 8 , N2 > 8)

wpe4.jpg (3227 bytes)

 


  1. Mann y Whitney (1947):"On a test of wether one of two random variables is stochastically largers than the other" Ann.Math.Statis., 22,125-128
  2. Potencia del Test U de Mann y Whitney: Aplicado sobre un caso que cumpla las condiciones de aplicación del test t ( normalidad e independencia de las dos muestras) alcanza un 95% de la potencia del test parámetrico.
  3. Las tablas  de los valores críticos para distintas combinaciones de tamaños muestrales se deben a  R.C. Milton: Milton,R.C.(1964): " An extendent table of critical value for the Mann-Whitney two-sample statistic" Journal of American Statistical Society, 59,925-934 (1964)