HIPÓTESIS BÁSICAS DEL MODELO LINEAL

Sobre el modelo lineal:

M.L.S.:

yi= a + b xi + ei para i= 1,2,3,..., n

M.L.G.:

yi = b0+ b1x1i + b2x2i + . . . + bkxki+ ei para i= 1,2,...,n

que también pueden expresarse matricialmente como:      y = Xb + e

que establece la relación teórica entre las n observaciones de variable exógena y las de la(s) endógena(s).

Consideramos además las siguientes hipótesis básicas:

" i ei sigue una N (0, s ) las perturbaciones aleatorias se distribuyen normalmente con media cero y desviación típica (varianza) constante (homoscedasticidad) en todos los periodos o localizaciones considerados.

" i ¹ j D(ei ej) = 0 Las n perturbaciones aleatorias están incorrelacionadas ( al ser normales, son independientes).

(hipótesis de no autocorrelación)

Como consecuencia de estas dos hipótesis: e sigue una Nn(0; s2 I)

3ª La variable x (las variables x1,x2, . . .,xk) es (son) de naturaleza no aleatoria. Además sus valores son independientes de la perturbación aleatoria.Y en el caso del M.L.G. las variables x1,x2, . . .,xk están incorrelacionadas (hipótesis de ausencia de multicolinealidad)

Como consecuencia de estas hipótesis tendremos que el comportamiento teórico de las observaciones de y deberá ser tal que:

yi sigue una N(a + bxi; s ) con D(yiyj) = 0 " i ¹ j en el M.L.S.

yi  sigue una N(b0 + b1x1i+ . . . + bkxki ; s ) con D(yiyj) = 0 " i ¹  j en el M.L.G.

y por lo tanto, para cualquiera de los dos casos la distribución conjunta del vector de observaciones:
y sigue una N
n( Xb ; s2 I )

A partir de estas hipótesis podremos considerar que los valores observados de la variable y son "como si fueran" datos muestrales de una población normal de las características señaladas arriba y podremos plantearnos realizar inferencias sobre los parámetros (a,b y s ,en el M.L.S. o b0,b1, . . .,bk y s en el caso del M.L.G.)