INTRODUCCIÓN A LOS CONTRASTES DE HIPÓTESIS
ERROR TIPO I
ERROR TIPO II
FUNCIÓN DE POTENCIA

ir a contrastes

El problema del contraste de hipótesis consiste básicamente en comprobar cotejar, decidir , en definitiva , sobre la veracidad de una hipótesis prefijada previamente como supuestamente cierta . En términos estadísticos , la o las hipótesis que formulamos lo serán lógicamente sobre la población. Bien afectando a algún parámetro de ésta , lo que da origen a los contrastes paramétricos o bien a otras características de la mismas que no lo sean estrictamente, lo que origina contrates "no" paramétricos . Si bien este capítulo esta dedicado a los contrastes paramétricos , esta introducción puede considerarse común a ambos tipos de contrastes .

La solución estadística del problema de contrastación se basará en los datos muestrales y la base estadística ( probabilística ) de la que arrancará el contraste va a ser la distribución de algún estadístico muestral.
Supongamos que deseamos hacer un contraste acerca de un parámetro q , de la población .Para llevarlo acabo consideraremos la distribución de algún estadístico muestral que de alguna manera se corresponda y se relacione con el parámetro q ; designemos en general a este estadístico como T. Si con los datos muestrales obtenemos un valor concreto para T tal que pertenezca a una determinada región del campo de variación de T optaremos por no rechazar la hipótesis y en caso contrario por rechazarla . Obviamente la clave del problema será delimitar la región del campo de variación de T que consideraremos como zona de aceptación de la hipótesis .Esto se resolverá por un criterio probabílistico partiendo de la distribución muestral de T.

Pasemos a definir los principales conceptos implicados en nuestro problema :

Región crítica . Será aquella región del campo de variación del estadístico tal que si contiene al valor evaluado del mismo con los datos muestrales nos llevará a rechazar la hipótesis . La designaremos por R1

Región de aceptación. Es la región complementaria de la anterior .Si el valor evaluado del estadístico pertenece a ella No rechazamos la hipótesis.(Las hipótesis nunca se aceptan de forma definitiva, sólo se aceptan provisionalmente, es decir ,no se rechazan, a la espera de una nueva información que eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos por R0 . Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.

Una hipótesis estadística (paramétrica) es una conjetura sobre el valor concreto que tiene en realidad. El establecer una hipótesis sobre un parámetro q , supone dividir los posibles valores del parámetro en dos grupos disjuntos tales que unos son hipotéticamente ciertos( q 0) y los otros(q 1) no lo son . A la hipótesis que se desea contrastar se la denomina "hipótesis nula" , siendo , por tanto, el valor o valores q 0 que hipotéticamente consideramos reales , dicha hipótesis viene expresada como H0. Alternativamente y consecuentemente se establece la denominada "hipótesis alternativa " (H1 )compuesta ésta por el valor o valores q 1 que en consecuencia de la elección y de la complementariedad de los de la hipótesis nula , son los que , en principio, no consideramos cómo hipotéticamente reales.

El hecho de que las hipótesis , tanto la nula cómo la alternativa puedan recoger en sus planteamientos uno o varios valores , da lugar a hipótesis de carácter simple , si el número de valores plausibles e hipotéticos es de uno en ambas , o bien a hipótesis compuestas si dicho valor no es único en alguna de ellas.

Teniendo en cuenta lo dicho anteriormente , el problema de rechazar o aceptar una hipótesis puede plantearse como un problema de decisión , en el que evidentemente existe la posibilidad de fracasar o acertar en la elección o decisión a la hora de concluir que la hipótesis, bien nula bien alternativa, son rechazables o no , dado , claro está ,que no conocemos la verdad.

El problema de decisión :rechazo/no rechazo, vendría expresado en las siguientes opciones en forma de tabla :

HIPÓTESIS/ACCIÓN-DECISIÓN NO RECHAZAMOS RECHAZAMOS
ES CIERTA CORRECTO ERROR TIPO I
ES FALSA ERROR TIPO II CORRECTO

 Así :
Si la hipótesis nula (H0) es cierta y nuestra decisión es no rechazarla, la decisión ha sido correcta         Si la hipótesis nula (H0) es cierta y nuestra decisión es rechazarla, la decisión provoca un error . Dicho error se denomina error tipo I. 
Si la hipótesis nula (H0) es falsa y nuestra decisión es no rechazarla, la decisión provoca un error . Dicho error se denomina error tipo II.
Si la hipótesis nula (H0) es falsa y nuestra decisión es rechazarla , la decisión ha sido correcta.

Las situaciones anteriores , tanto las que plantean un error cómo las que plantean acierto , son incontrolables e incomprobables (en ese momento) por lo que la única manera de abordar el problema radica en conocer o establecer las probabilidades con las que se pueden cometer los errores .Así tendríamos que :

a ,es la probabilidad de cometer un error tipo I , es decir , la probabilidad de rechazar una hipótesis que en verdad es cierta . Puede recordarse del tema anterior que así definíamos y denotábamos al nivel de significación. Es también a el tamaño de la región crítica del contraste.    Si es la probabilidad de cometer un error evidentemente deberá ser un valor pequeño , próximo a 0.

b ,es la probabilidad de cometer un error tipo II , es decir , la probabilidad de no rechazar una hipótesis que en la realidad es falsa , no tiene nombre concreto que la denote , si bien su complementaria 1-b (probabilidad de rechazar una hipótesis que es falsa) se denomina potencia del contraste para el caso de contraste simple y función de potencia para el caso en el que el contraste fuera del tipo compuesto.
Analíticamente lo expresado anteriormente quedaría de la siguiente manera :

Siendo q el parámetro desconocido de la población sobre el que queremos realizar un contraste Siendo T un estadístico relacionado con q y al que la muestra específica realizada a concretado un valor T .
Siendo R1 la región crítica del contraste ; región de valores que dan lugar a rechazar la hipótesis.
Siendo q 0 el valor asignado hipotéticamente a q , y que constituye , por tanto la H0

Tendremos que =P[error tipo I]=
=P[T esté en la zona de rechazo siendo cierta la hipótesis]=
=P[T no pertenezca a la zona de aceptación siendo cierta la hipótesis]=
=

Tendremos también que =P[error tipo II]=
=P[T esté en la zona de No rechazo siendo falsa la hipótesis]=
=P[T no esté en la zona de rechazo siendo falsa la hipótesis]=

Además        =
=P[T esté en la zona de rechazo siendo falsa la hipótesis]=
=P[T no esté en la zona de aceptación siendo falsa la hipótesis]=
=P[T esté en la zona de rechazo siendo cierta la hipótesis alternativa H1]=

Por último =
=P[ T esté en la zona de no rechazo siendo cierta la hipótesis]

Es evidente que dado que no conocemos la realidad de la población no podemos conocer en que situación nos encontramos. De ahí que intentemos controlar la aparición de errores en el sentido de hacer que la probabilidad de cometerlos sea mínima ; minimizando el error tipo uno(nivel de significación) y el error tipo dos , maximizando ,en este caso, la potencia del contraste dada su complementariedad. Ambos planteamientos idóneos ( mínimo a , mínimo b (máximo 1-b ) no son posibles dado que nivel de significación y potencia del contraste no son independientes. Por lo que debemos plantearnos prefijar como mínimo(a ó b ) el error que suponga menor coste a la hora de las consecuencias de su aparición .

Comentado en términos genéricos la realización del contrates quedaría en la siguiente forma :

Conocemos que la distribución de los estadísticos muestrales depende de la distribución y parámetros poblacionales . En consecuencia la distribución de T dependerá del valor del parámetro a contrastar q . De forma que podemos construir la distribución del estadístico T condicionada al valor hipotético de q , es decir , q = q 0 siendo esta la hipótesis nula del contraste.

Conocida la distribución y una vez prefijado el nivel de significación del contraste , tendremos que delimitar la región

R0 [a , b] en la que se verifique que :

Determinar esta región (zona) [ a, b] es un problema análogo , pero recíproco al de la construcción de un intervalo de confianza 1-a . dado que :

       es decir

Si en la construcción del intervalo de confianza nos interesaba que la amplitud del intervalo fuera lo menor posible para disponer de estimaciones más precisas, aquí nos interesa que los intervalos externos (región crítica o de rechazo)  cuya expresión es : ]-¥ ,a] [b,¥ [    sean lo más grandes posibles  para apurar más (hilar más fino) a la hora de aceptar la hipótesis.(Se trata de poner difícil la aceptación de la hipótesis :hacer un contraste duro).Y si la región crítica debe ser lo mayor posible la de aceptación [a,b] deberá ser lo menor posible. Y como ya conocemos, si la distribución es simétrica y unimodal el intervalo de menor amplitud (y , por tanto ,de mayor densidad media de probabilidad ) de todos los intervalos que cumplen que P[T Î [ a, b]] = 1-a será el intervalo centrado en la media.

Una vez determinadas las regiones crítica y de aceptación (una vez determinados a y b ) y de manera sencilla el contraste se realiza de la siguiente manera
Si los datos muestrales dan lugar a un estadístico T tal que si :

T ( con hipótesis) Î [a,b] ® NO rechazamos hipótesis : q =q 0

T ( con hipótesis) Ï [a,b] ®  rechazamos hipótesis : q =q0

  Tratemos a partir de ahora de establecer algunos contrastes de interés