BONDAD DEL AJUSTE
Varianza residual
Varianza de la regresión
Coeficiente de determinación

Por bondad del ajuste hay que entender el grado de acoplamiento que existe entre los datos originales y los valores teóricos que se obtienen de la regresión.Obviamente cuanto mejor sea el ajuste, más útil será la regresión a la pretensión de obtener los valores de la variable regresando a partir de la información sobre la variable regresora .

Obtener indicadores de esta bondad de ajuste es fundamental a la hora de optar por una regresión de un determinado tipo u otro.

Puesto que la media de los residuos se anula, el primer indicador de la bondad del ajuste (no puede ser el error medio) será el error cuadrático medio, o varianza del residuo, o varianza residual :

Considerando la regresión Y/X:

                                                                   

Que será una cantidad mayor o igual que cero.De forma que cuanto más baja sea mejor será el grado de ajuste.Si la varianza residual vale cero el ajuste será perfecto (ya que no existirá ningún error ).

 

                        Del hecho de que yi=y*i+ei ,y de que las variables y* ý e están incorrelacionadas se tiene que:

                                                               

                    Donde S2y* es la llamada varianza de la regresión y supone la varianza de la variable regresión:

                                                                       

Igualdad fundamental anterior de la que se deduce que la varianza total de la variable y puede descomponerse en dos partes una parte explicada por la regresión( la varianza de la regresión) y otra parte no explicada (la varianza residual).

Considerando que la varianza nos mide la dispersión de los datos este hecho hay que entenderlo como que la dispersión total inicial queda, en parte explicada por la regresión y en parte no.Cuanto mayor sea la proporción de varianza explicada (y menor la no explicada) tanto mejor será el ajuste y tanto más útil la regresión.

A la proporción de varianza explicada por la regresión se le llama coeficiente de determinación ( en nuestro caso lineal):                

que evidentemente estará siempre comprendido entre 0 y 1 y, en consecuencia, da cuenta del tanto por uno explicado por la regresión.

Una consecuencia importante en la práctica es que la varianza residual será obviamente:

Es sencillo probar que en el caso lineal que nos ocupa el coeficiente de determinación coincide con el cuadrado del coeficiente de correlación: R2 = r2

Con lo cual la varianza residual y la varianza debida a la regresión pueden calcularse a partir del coeficiente de correlación:

ir a regresión