1 Introducción


El objeto del tema es la cuantificación de la incertidumbre, lo cual tiene mucho que ver con la previsibilidad del comportamiento. Hemos visto que el Análisis de Regresión es una técnica para obtener predicciones, y que, excepto en el caso de covariación perfecta, las predicciones son más o menos erróneas. En consecuencia, hay incertidumbre en las predicciones, y esta es la situación habitual. La imprevisibilidad genera incertidumbre.

Los matemáticos vienen estudiando esta cuestión ya hace muchos años, y han facilitado herramientas precisas que dan resultados exactos en situaciones relativamente sencillas y fácilmente formalizables. Cuando se estudia el comportamiento, sin embargo, las cosas son diferentes porque el comportamiento se caracteriza por la complejidad, y su estudio requiere frecuentemente técnicas complejas. Los conceptos básicos de la probabilidad son de interés porque son el fundamento de procedimientos más sofisticados que sirven para cuantificar la incertidumbre.

Los matemáticos no son los únicos que miden la incertidumbre: Todo el mundo lo hace cada día. Por ejemplo: Un conocido nos pide un préstamo por una cantidad importante, y de una manera intuitiva evaluamos la probabilidad de que nos devuelva el préstamo y decidimos en consecuencia. Otro ejemplo: Tenemos un trabajo seguro en una empresa, y nos ofrecen un trabajo mejor pagado en otra; generalmente evaluamos la incertidumbre de la nueva situación antes de tomar una decisión. Estas evaluaciones son más o menos intuitivas, y no suponen una cuantificación precisa de la incertidumbre, pero el fundamento de como suelen hacerse se asemeja a algunas aproximaciones formales a la probabilidad, que la definen como la frecuencia en que ocurre el acontecimiento.

Los matemáticos definen la probabilidad de ocurrencia de un acontecimiento A (hay también otras definiciones) como la razón entre la frecuencia de A (número de veces que es observado) y el número de veces en que podría ocurrir:

Pero difícilmente podemos medir la incertidumbre del comportamiento aunque la fórmula sea sencilla. Volviendo al ejemplo, es difícil recoger datos exactos de todas las ocasiones en que un individuo ha tenido la oportunidad de engañar, y la de todas las veces que la ha hecho; en consecuencia difícilmente podremos obtener una medida precisa de la probabilidad de que devuelva el préstamo. En otras situaciones sí podemos obtener una aproximación más precisa a la probabilidad. Por ejemplo, la de que un estudiante seleccionado al azar obtenga "Notable". Esta probabilidad es el número de estudiantes que obtienen "Notable" dividido por el número total de estudiantes del curso:

En el ejemplo, diremos que la probabilidad de que un estudiante seleccionado al azar obtenga "Notable" es igual a 0.2 (dado que 100 estudiantes han obtenido Notable en un curso en 500 estudiantes).

 

Teorema de Bayes

El teorema de Bayes es un procedimiento para obtener probabilidades condicionales (probabilidades de ocurrencia de acontecimientos condicionadas a la ocurrencia de otros acontecimientos). La expresión del teorema de Bayes para dos variables discretas es:

Para variables que toman más de dos valores, la expresión es:

El teorema de Bayes da respuesta a cuestiones de tipo causal, predictivas y de diagnóstico. En las cuestiones causales queremos saber cuál es la probabilidad de acontecimientos que son la consecuencia de otros acontecimientos. En las cuestiones predictivas queremos saber cuál es la probabilidad de acontecimientos dada información de la ocurrencia de los acontecimientos predictores. En las cuestiones de tipo diagnóstico queremos saber cuál es la probabilidad del acontecimiento (o acontecimientos) causales o predictivos dado que tenemos información de las consecuencias. Para resumir, en las situaciones causales o predictivas desconocemos las consecuencias y tenemos evidencia de las causas. Por el contrario, en las situaciones de diagnóstico desconocemos las causas y tenemos evidencia de las consecuencias.

 

Ejemplo

Unos psicólogos especializados en el tratamiento de trastornos de personalidad están interesados en diagnosticar el trastorno que afecta un paciente, en el que observan un conjunto de síntomas que indican que el paciente podría sufrir el trastorno A o el trastorno B. Además saben que los porcentajes de individuos afectados por los trastornos A, B o ningún trastorno son 10, 30 y 70. También saben que el porcentaje de individuos afectados por el trastorno A y que muestran el síntoma X es igual al 60%, el porcentaje de individuos que sufren el trastorno B y muestran el síntoma X es el 30% y el porcentaje de individuos no afectados que muestran los síntomas de trastorno es el 10%. Resumiendo, la información que disponemos es:

Sustituyendo en el teorema de Bayes:

la probabilidad de que el individuo padezca el trastorno A es 0.27. Las probabilidades de que esté afectado por el trastorno B o el C son:

La conclusión es que lo más probable es que el individuo padezca el trastorno B, pero es un valor moderado y los psicólogos piensan que hay que obtener más evidencia.

El teorema de Bayes es especialmente adecuado para actualizar las conclusiones a medida que disponemos de nueva información. Pasado un tiempo observan que el paciente muestra un nuevo síntoma (Y), y saben que presentan Y el 70% de los individuos que sufren el trastorno A, el 20% de los individuos que sufren B y el 10% de los individuos que padecen el trastorno C. Para obtener las probabilidades incorporando la nueva información hacemos que las probabilidades posteriores pasen a ser las probabilidades previas:

Una vez hechos los cálculos la probabilidad de que el individuo esté afectado por el trastorno A ha pasado de 0.27 a 0.62