Es la tasa de error de uso clásico en Estadística.
Correcta para un número pequeño de hipótesis.
Es un criterio muy exigente si tenemos un número de hipótesis muy grande.
Notemos que nos fijamos en cometer al menos un error cuando con frecuencia tendremos decenas de miles de contrastes.
Como (mala) contrapartida muchos genes que tienen una expresión diferencial realmente no serán detectados.
FDR: false discovery rate
O tasa de falsamente rechazados
Definimos: \(Q = \frac{V}{R}\) si \(R >0\) y \(Q = 0\) en otro caso.
Proporción de tests erróneamente rechazados.
\[FDR = E (Q) = E \bigg ( \frac{V}{R} \bigg | R >0 \bigg ) P(R > 0).\]
Una modificación importante: pFDR (Positive false discovery rate) \[pFDR = E \bigg ( \frac{V}{R} \bigg | R >0 \bigg ).\]
Relación entre las tasas de error tipo I
Se verifican las siguientes desigualdades: \[
FDR \leq FWER.
\]
p-valor ajustado
Para cada contraste \(H_i\) tendremos un p-valor \(p_i\).
Podemos contrastar el contraste \(H_i\) con un nivel de significación \(\alpha_i\) rechazando la hipótesis nula \(H_i\) si \(p_i \leq \alpha_i\) y no rechazando en otro caso.
Cuando consideramos simultáneamente todos los tests los valores \(\alpha_i\) serán distintos y por ello tendríamos que ir comprobando si la desigualdad \(p_i \leq \alpha_i\) se verifica o no.
La idea del p-valor ajustado es transformar el p-valor \(p_i\) en otro valor \(\tilde{p}_i\), el i-ésimo p-valor ajustado, de modo que sean equivalentes: \[p_i \leq \alpha_i\] y \[\tilde{p}_i \leq \alpha\] siendo \(\alpha\) el valor que especificamos para controlar alguna de las tasas de error tipo I.
Método de Bonferroni
Rechazamos \(H_i\) si \[p_i \leq \frac{\alpha}{N}.\]
Estimamos \(\pi_0 = N_0 /N\) con \[
\hat{\pi}_0 = \frac{|\{p_i: p_i > \lambda; i = 1,\ldots,N\}|}{N (1- \lambda)}.
\]
Podemos pues estimar pFDR con \[
\widehat{pFDR} = \frac{\hat{\pi}_0 N t}{|\{p_i: p_i \leq t\}|}.
\]
El q-valor asociado a un contraste sería el mínimo valor de pFDR que se alcanza cuando el contraste es rechazado.
El q-valor asociado al test \(i\)-ésimo sería \[
q(p_i) = \min_{t \geq p_i} pFDR(t)
\] y su estimador sería \[
\hat{q}(p_i) = \min_{t \geq p_i} \widehat{pFDR}(t).
\]