DISTRIBUCIÓN BINOMIAL.

Nos encontramos con un modelo derivado de un proceso experimental puro, en el que se plantean las siguientes circunstancias.

· Se realiza un número n de pruebas (separadas o separables).

· Cada prueba puede dar dos únicos resultados A y Ã

· La probabilidad de obtener un resultado A es p y la de obtener un resultado à es q, con q= 1-p, en todas las pruebas. Esto implica que las pruebas se realizan exactamente en las mismas condiciones y son , por tanto ,independientes en sus resultados. Si se trata de extracciones, (muestreo), las extracciones deberán ser con devolución (reemplazamiento) , o bien población grande (M.A.S). A este respecto hagamos una consideración: si el proceso consiste en extraer individuos de una población y observar si poseen cierta característica: el parámetro n será el número de extracciones (tamaño muestral) y el parámetro p la proporción de individuos de la población que poseen la característica en cuestión. Se ha comentado que para que la probabilidad, de que en cada extracción obtengamos un individuo poseedor de la característica sea constante en todas la pruebas es necesario que las proporciones poblacionales no cambien tras cada extracción es decir se reemplace cada individuo extraído .Sin embargo si la población es muy grande, aunque no reemplacemos los individuos extraídos las variaciones en las proporciones de la población restante serán muy pequeñas y, aunque de hecho las probabilidades de, obtener un éxito varíen tras cada prueba, esta variación será muy pequeña y podremos considerar que son constantes .

Ilustremos con un ejemplo:

Supongamos que una ciudad hay 1000000 de habitantes de los cuales 450000 son varones y 550000 son mujeres . Si extraemos un individuo al azar la probabilidad. de que sea mujer será.
Si repetimos esta prueba varias veces y no reponemos "en el saco" al sujeto extraído la probabilidad de obtener una mujer en cada siguiente extracción variará, al variar la composición por sexos de la población restante. Sin embargo, al ser la población tan grande, la variación de esta probabilidad con cada sucesiva prueba será prácticamente despreciable y podremos considerar, en la práctica que las probabilidades son constantes: en efecto:

Si, en la primera prueba obtenemos una mujer y no la reintegramos a la población la de probabilidad de obtener una mujer en la segunda prueba será:
                                
Si por el contrario en la primera prueba se obtiene un varón la probabilidad de obtener una mujer el siguiente será:                           
Por lo tanto bien podríamos considerar que la probabilidad de extraer una mujer en sucesivas elecciones aleatorias es constante. En consecuencia, si consideráramos el muestreo de 10 individuos de esa ciudad, aunque no reemplazáramos las extracciones, la variable aleatoria x = número de mujeres obtenidas en las diez extracciones, seguiría una distribución binomial de parámetros n = 10 Y p= 0.55.

Sin embargo, si la población es pequeña, las variaciones de la probabilidad de éxito con cada prueba serán importantes sino se devuelve a la población original cada sujeto extraído .En este caso, no podremos considerar que p y q son constantes a lo largo de todo el proceso y el número de éxitos obtenidos en n pruebas será una variable aleatoria que no seguirá una distribución binomial sino una nueva distribución que estudiaremos , más tarde llamada hipergeométrica.

· En estas circunstancias se aleatoriza de forma que variable aleatoria signifique:

X = nº de resultados A que se obtienen en las n pruebas

Se plantean dos valores con variación por lo que tendremos dos parámetros p y n , por lo que la distribución binomial se explicitará :
El campo de variación de la variable será {0,1,2,3,..., n}, por lo que no es necesario comentar que es de carácter discreto. Así tendremos que si queremos calcular la probabilidad de que X=1 en n pruebas , tendríamos 1 resultado A y n-1 resultados no A.

Prueba 1

Prueba 2

Prueba 3

…….

 

Prueba n

Prueba

No A

No A

No A

No A

No A

A

Resultado

q

q

q

q

q

p

Probabilidad

Por lo que la probabilidad de conseguir un resultado A sería en principio , y dado que las pruebas son independientes . Lo que sería correcto si el resultado A , lo fuera en la última prueba. Dado que nos es indiferente en que prueba sea tendríamos que multiplicar esta probabilidad por . Por lo que tendríamos que:
generalizando para cualquier valor de X , quedaría que la función de cuantía de la binomial  tiene como expresión          

 

 

Gráficamente la función de cuantía quedaría de la siguiente manera , siempre dependiendo de los valores que tomen los parámetros . En este caso se trata de una B(0,2;10),siendo la representación gráfica de su función de cuantía:

     

 

 


La función de distribución será para cada valor k de la variable  

Los indicadores-momentos (media y varianza) pueden obtenerse a partir de la función de cuantía (operador esperanza) o  partiendo de F.G.M.:

Siendo la F.G.M.:  

                                    

desarrollando el Binomio de Newton obtendríamos ,

También podríamos haber obtenido la F.G.M. , partiendo del hecho de que la distribución o modelo binomial es la reiteración n veces del modelo dicotómico, Así si:
es decir realizamos una prueba con probabilidad de éxito p , siendo la aleatoriación el número de resultados A en esa prueba . Tendremos que un serie de pruebas independientes (n) con probabilidad de A en cada prueba , será la agregación de n dicotómicas . Si X es el número de resultados A en esas n pruebas y por tanto una Binomial n,p. Así

                             
De esta manera si conocemos que la F.G.M de la dicotómica (Y) es   

dado que  

la F.G.M. de X (binomial) será el producto , n veces , de la F.G.M de Y ( dicotómica) dado que las Y son independientes. Así    

           Mediante la aplicación del teorema de los momentos podemos calcular las ratios del modelo.

           La media sería

             si hacemos t =0          

                    por lo que la media sería       

Podríamos haber calculado la media partiendo de la binomial como reiteración de dicotómicas ; así

                Si conociendo que la media de Y= p

             

              que lógicamente nos resulta con el mismo resultado

La varianza de la Binomial vendría dada por

Siendo

 

si hacemos t =0        

o lo que es lo mismo

                             

Así                    

           Luego la varianza sería

Calculando la varianza de la binomial como reiteración de dicotómicas sería

Si conociendo que la varianza de Y= pq

                  

Partiendo de la F.G.M obtendríamos los diversos momentos ordinarios necesarios para el cálculo de otros coeficientes como el de asimetría y curtósis. Cuyas expresiones son las siguientes.

Coeficiente de Asimetría en el que se puede comprobar que si p=q=0,5 su valor es cero, lo que nos indica simetría para este valor del parámetro p , siendo el que fuere n

Coeficiente de Curtósis siendo mínimo para p=q=0,5

En cuanto a la Moda ,dado que es el valor de la variable con mayor probabilidad (maximiza su función de probabilidad). Tendremos que si Xo es el valor modal

                                  P(Xo) ³ P(Xi) para cualquier valor de i , en particular se verificará que

P(Xo) ³ P(Xo +1) y P(Xo) ³ P(Xo-1) es decir que el valor de la función de cuantía para el valor modal será mayor que dicho valor para los valores anterior y posterior a la moda.

Sustituyendo por las correspondientes funciones de cuantía en ambas inecuaciones , llegaremos a la expresión :

                                              pn - q £ Xo £ pn + p

                                            Siendo Xo el valor modal

Generalmente será un único valor ( la parte entera de la media), y podrán ser dos valores modales cuando pn + p ( ó pn-q) sea un número entero. Como ejemplo: si lanzamos un dado 10 veces y queremos saber cúal es el número más probable de ases que conseguiremos tendremos que calcula la moda en un modelo B(1/6;10) .Aplicando la desigualdad anterior tendríamos : 1/6·10-5/6≤Mo≤1/6·10+1/6 . Es decir 5/6≤Mo≤11/6
Sólo existe un número natural que verifique esa cota , el 1 . Para que hubiera más de una moda , ambos valores de la desigualdad debieran ser números naturales como los valores de la variable X con distribución binomial

Teorema de adición en la binomial

Se dice que una distribución verifica el Teorema de adición, para alguno de sus parámetros, o que es reproductiva, si dadas 2 o más variables aleatorias independientes que siguen todas ellas una distribución de ese tipo con parámetros distintos, la variable suma de todas ellas sigue, también una distribución de ese tipo con parámetros la suma de los parámetros de las variables originales.

Este teorema se prueba siempre a partir de la F.G.M. Se procede obteniendo la F.G.M. de la distribución de la variable suma , que por ser las variables originales independientes será el producto de las F.G.M. de las distribuciones de las variables originales. Una vez obtenida la F.G.M. comprobaremos si efectivamente se trata de F.G.M. de una distribución de ese tipo con parámetros la suma de los parámetros de las distribuciones de las variables originales .En virtud del carácter recursivo de la operación suma , para demostrar el teorema basta con demostrar que se cumple para la suma de dos variables aleatorias.

Pues bien, la distribución binomial verifica el teorema de adición para el parámetro n , aunque no lo verifica para el. parámetro p (además es necesario para que se verifique el teorema que el parámetro p de las distribuciones de las variables originales sea el mismo) :

"La variable suma de dos o más variables binomiales independientes de parámetros (n1,p) : (n2,p) : ………….... se distribuye como una distribución binomial de parámetros ( n1+n2+…, p) "

En efecto :

sean X e Y dos variables alaeatorias independientes tales que:

pretendemos probar que

Conocemos que la F.G.M del modelo binomial es para X   

                                                                  siendo para Y  

Dado que X e Y son independientes la F.G.M. de la distribución de la variables suma será el producto de las dos F.G.M.

                        

                        que es la F.G.M. de una B( n1+n2, p).

Observesé que este teorema se utilizó para el cálculo de la F.G.M. de la Binomial como reiteración (suma) de Dicotómicas , con la salvedad de tomar a la Dicotómica como una Binomial de n = 1 , es decir adición de n binomiales B(1,p)

 

(ir a script de la binomial)                       

ir a modelos de probabilidad