Proponen un nuevo enfoque estadístico para cuantificar la incertidumbre en presencia de información incompleta

Un equipo de investigación de cinco universidades españolas, entre ellas la Universitat de València (UV), ha desarrollado una nueva metodología estadística que permite seleccionar variables relevantes incluso cuando la información está incompleta. El estudio ha sido publicado en “Bayesian Analysis”, una de las revistas más prestigiosas del área.
El trabajo aborda de forma novedosa el problema de cuantificar la incertidumbre que se tiene sobre los modelos estadísticos utilizados para representar la realidad, contemplando la posibilidad de que haya datos con valores faltantes, una situación muy común en estudios científicos y análisis de datos reales.
“Esta investigación supone un hito al incorporar de forma eficiente todas las fuentes de incertidumbre que se generan cuando se recogen datos de forma parcial o se pierde parte de estos en el proceso. La alternativa en muchas ocasiones es eliminar por completo la muestra (por ejemplo, un paciente), que tenía esa información perdida, posiblemente, solo en una de las variables recogidas. Nuestra metodología permite, por tanto, aprovechar mejor la información que sí se ha recopilado, evitando los sesgos que se pudieran producir al eliminarla por completo”, ha destacado Anabel Forte Deltell, investigadora del Departamento de Estadística e Investigación Operativa de la UV y firmante de la investigación.
Frente a las estrategias habituales que implican la desestimación de datos con valores faltantes o que utilizan métodos de selección de variables que arrojan resultados con falsos positivos, se propone una metodología bayesiana objetiva que integra directamente la incertidumbre sobre los datos faltantes en el proceso de inferencia.
Esta aproximación mejora la robustez de los modelos, evita errores comunes en la selección de variables y permite obtener resultados más fiables, incluso cuando los conjuntos de datos contienen grandes proporciones de valores perdidos.
El artículo, “Model Uncertainty and Missing Data: An Objective Bayesian Perspective”, ha sido seleccionado para discusión pública por expertos, una distinción reservada a los trabajos más relevantes, según el editor jefe de la revista “Bayesian Analysis”. La discusión se defenderá en un webminar, el próximo 5 de noviembre.
Este trabajo ha sido realizado, además de por Anabel Forte Deltell, por Gonzalo García-Donato (Universidad de Castilla-La Mancha), María Eugenia Castellanos (Universidad Rey Juan Carlos), Stefano Cabras (Universidad Carlos III de Madrid) y Alicia Quirós (Universidad de León). La investigación ha sido financiada por el Ministerio de Ciencia, Innovación y Universidades y por la Agencia Española de Investigación, a través de las ayudas a proyectos de Generación de Conocimiento.
Referencia: Gonzalo García-Donato. María Eugenia Castellanos. Stefano Cabras. Alicia Quirós. Anabel Forte. “Model Uncertainty and Missing Data: An Objective Bayesian Perspective”. Bayesian Anal. Advance Publication 1 - 73, 2025. https://doi.org/10.1214/25-BA1531