5/16/23
gse21779_1
[1] "1007_s_at" "1007_s_at" "1007_s_at" "1007_s_at" "1007_s_at" "1007_s_at"
[1] "1552281_at"
[1] 11
[1] 1088751 883561 1054203 366753 178855 68793 490689 62456 1123802
[10] 939573 1349651 1089915 884725 1055367 367917 180019 69957 491853
[19] 63620 1124966 940737 1350815
[1] 1088751 883561 1054203 366753 178855 68793 490689 62456 1123802
[10] 939573 1349651
[1] 1089915 884725 1055367 367917 180019 69957 491853 63620 1124966
[10] 940737 1350815
Consideremos una función bicuadrada (bisquare) definida como \[ w(u) = \left\{ \begin{array}{cl} (1- u^2)^2 &\mbox{si $|u| \leq 1$} \\ 0 &\mbox{si $|u| >1$} \end{array} \right.\]
Se define el estimador en un solo paso como \[ T_{bi}(x_1,\ldots,x_n) = \frac{\sum_{i=1}^n w(u_i) x_i}{\sum_{i=1}^n w(u_i)}. \]
Si sustituimos el valor \(m_x\) por \(T_b\) podríamos aplicar iterativamente el procedimiento hasta que se estabilice.
El valor observado aleatorio \(S\) sería \[ S = X + Y \] con \(X \sim Exp(\alpha)\) e \(Y \sim N(\mu,\sigma^2)\).
Se tiene \[
E(X | S = s) = a + b \frac{\phi(\frac{a}{b})}{\Phi(\frac{a}{b})}
\] siendo \(a = s - \mu - \sigma^2 \alpha\) y \(b= \sigma\) mientras que
\(\phi\) y \(\Phi\) denotan las funciones de densidad y de distribución de una normal estándar (con media 0 y varianza 1).
Los parámetros del modelo (\(\alpha, \mu, \sigma^2\)) se estiman mediante un procedimiento no paramétrico.
Consideramos la matriz para cada grupo de sondas. \[ \begin{array}{ccc|c} \delta_{1,1} & \cdots & \delta_{1,n} & a_1 \\ \vdots & \ddots & \vdots & \vdots \\ \delta_{|S_k|,1} & \cdots & \delta_{|S_k|,n} & a_{|S_k|}\\ \hline b_1 & \cdots & b_{n} & m \end{array} \]
Fijamos \(\delta_{ij} = \log_2(y_{ij})\), \(a_i = b_i = 0 \forall i,j\).
Calculamos la mediana para cada fila a lo largo de las columnas ignorando la última columna (separada por la línea).
Restamos a cada elemento de la fila la mediana correspondiente. Esta mediana se suma a la última columna (formada por \(a_1, \ldots, a_{|S_k|},m\).
Calculamos la mediana para cada columna de los valores correspondientes a las distintas filas sin considerar la última fila.
Restamos la mediana calculada en el paso anterior a cada elemento de la columna exceptuando la última fila. A la última fila sumamos las medianas calculadas.
El proceso descrito en los cuatro pasos anteriores continua iterando sucesivamente entre filas y columnas hasta que los cambios que se producen son nulos o muy pequeños.
Una vez finalizado el proceso iterativo tendremos:
\(\hat{\mu} = m\)
\(\hat{\theta}_j = b_j\)
\(\hat{\alpha}_i = a_i\)
\(\hat{\epsilon}_{ij} = \delta_{ij}\)
¿Y cómo estimamos la expresión de un grupo de sondas en una array? \[ \hat{\mu} + \hat{\theta}_j \]
Y esto lo repetimos para cada grupo de sondas.
El método MAS5
El método RMA