7. Regressió múltiple, r múltiple i parcial

Hem vist com fer prediccions d'una variable en funció d'un altra. D'altra banda, és clar que el comportament és molt complex, i que fer prediccions amb una variable predictora és massa ximple. Sembla evident que milloraríem la possibilitat de predicció (o explicació) del comportament si utilitzem més d'una variable predictora. Per a resoldre esta qüestió es defineix la equació de regressió múltiple, la forma de la qual és (puntuacions directes):

Xi: variable predictora (o explicativa).

Bi: coeficient de la variable predictora Xi.

A: interceptal.

Com a exemple, és clar que si per a fer prediccions de les puntuacions de sensació de benestar de pacients sotmesos a teràpia obtenim millors prediccions si incloem a la equació variables com ara mesures de clima familiar, satisfacció laboral, etc.

La valoració de la capacitat de la equació de regressió múltiple per a fer prediccions es pot fer en el coeficient de determinació, que es interpretat de forma semblant a com ha estat explicat per a la equació de regressió simple: dona la proporció de variància explicada pel conjunt de variables predictores (o explicatives). El coeficient de determinació és el quadrat del coeficient de correlació múltiple, que és la correlació de Pearson entre la variable Y i la variable Y' (la variable que conté les prediccions de Y):

on el primer subíndex indica quina és la variable criteri i els altres indiquen quines són les variables predictores (o explicatives).

Coeficient de determinació:

El coeficient de correlació parcial mesura la correlació entre dues variables llevat l'efecte de la seva correlació amb un altra variable:

La expressió anterior es basa en la fórmula de la correlació de Pearson aplicada a les variables 1 i 2 una vegada les han llevat la part explicada per la variable 3: