2025-02-27
Primero instalamos R
Una vez instalado el R base la instalación de algun paquete adicional
apt update apt install r-base r-base-dev apt install libatlas3-base
apt update
apt upgrade
apt install libcurl4 libcurl4-openssl-dev libssl-dev libxml2-dev libcairo2-dev libxt-dev
sample1 sample2 sample3 sample4
gene1 7 6 4 6
gene2 6 4 4 3
gene3 2 6 9 8
gene4 5 4 4 4
gene5 5 6 7 5
gene6 6 5 9 7
gene7 2 3 7 7
gene8 7 4 4 4
gene9 4 3 2 6
gene10 2 8 5 6
La expresión del gen en la fila 6 y en la columna 2.
La expresión de los genes en la muestra 2 podemos hacerlo con
Borramos el espacio de trabajo.
¿Qué tipo de dato tenemos?
Es más cómodo trabajarlo como factor.
[1] ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL ALL
[20] ALL ALL ALL ALL ALL ALL ALL ALL AML AML AML AML AML AML AML AML AML AML AML
Levels: ALL AML
Veamos un resumen.
Gráficamente.
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,] -1.45769 -1.39420 -1.42779 -1.40715 -1.42668 -1.21719 -1.37386 -1.36832
[2,] -0.75161 -1.26278 -0.09052 -0.99596 -1.24245 -0.69242 -1.37386 -0.50803
[,9] [,10] [,11] [,12] [,13] [,14] [,15] [,16]
[1,] -1.47649 -1.21583 -1.28137 -1.03209 -1.36149 -1.39979 0.17628 -1.40095
[2,] -1.04533 -0.81257 -1.28137 -1.03209 -0.74005 -0.83161 0.41200 -1.27669
[,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24]
[1,] -1.56783 -1.20466 -1.24482 -1.60767 -1.06221 -1.12665 -1.20963 -1.48332
[2,] -0.74370 -1.20466 -1.02380 -0.38779 -1.06221 -1.12665 -1.20963 -1.12185
[,25] [,26] [,27] [,28] [,29] [,30] [,31] [,32]
[1,] -1.25268 -1.27619 -1.23051 -1.43337 -1.08902 -1.29865 -1.26183 -1.44434
[2,] -0.65264 -1.27619 -1.23051 -1.18065 -1.08902 -1.05094 -1.26183 -1.25918
[,33] [,34] [,35] [,36] [,37] [,38]
[1,] 1.10147 -1.34158 -1.22961 -0.75919 0.84905 -0.66465
[2,] 0.97813 -0.79357 -1.22961 -0.71792 0.45127 -0.45804
O las dimensiones de la matriz.
El nivel de expresión del gen que está en la fila 2000 y ha sido observado en la muestra 3 (columna 3).
Y todos los niveles de este gen lo tendremos con
[1] 0.73124 -0.19598 0.51981 -0.54371 0.55596 1.40683 0.79772 0.59493
[9] 0.99503 0.39529 0.09834 0.19595 0.85017 -1.39979 1.09789 -0.74362
[17] 0.44207 0.27698 -0.04128 -1.60767 -1.06221 -1.12665 0.47863 -0.44014
[25] 0.22286 0.42795 0.65427 0.07257 -0.28093 -0.20985 0.05160 -1.44434
[33] -0.17118 -1.34158 0.92325 -0.21462 -1.34579 1.17048
A estos niveles los llamaremos perfil de expresión.
[1] 0.73124 -0.19598 0.51981 -0.54371 0.55596 1.40683 0.79772 0.59493
[9] 0.99503 0.39529 0.09834 0.19595 0.85017 -1.39979 1.09789 -0.74362
[17] 0.44207 0.27698 -0.04128 -1.60767 -1.06221 -1.12665 0.47863 -0.44014
[25] 0.22286 0.42795 0.65427 0.07257 -0.28093 -0.20985 0.05160 -1.44434
[33] -0.17118 -1.34158 0.92325 -0.21462 -1.34579 1.17048
pacman::p_load(ggplot2)
muestra = 1:ncol(golub) ## En abscisas el número de la muestra
y2000 = golub[2000,] ## En ordenadas su expresión
df = data.frame(muestra = 1:ncol(golub),y2000= golub[2000,])
ggplot(df,aes(x = muestra,y= y2000))+geom_point()
[1] 0.73124 -0.19598 0.51981 -0.54371 0.55596 1.40683 0.79772 0.59493
[9] 0.99503 0.39529 0.09834 0.19595 0.85017 -1.39979 1.09789 -0.74362
[17] 0.44207 0.27698 -0.04128 -1.60767 -1.06221 -1.12665 0.47863 -0.44014
[25] 0.22286 0.42795 0.65427
[1] 0.07257 -0.28093 -0.20985 0.05160 -1.44434 -0.17118 -1.34158 0.92325
[9] -0.21462 -1.34579 1.17048
df = data.frame(muestra = 1:ncol(golub),y2000= golub[2000,],
tipo = golub.fac)
ggplot(df,aes(x = muestra,y= y2000,colour=tipo))+geom_point() +
xlab("Número de muestra") + ylab("Gen en fila 2000") +
facet_grid(tipo~.)
lapply
y sapply
La primera opción con lapply
.
Notar que hemos utilizado una función anónima.
Podemos conseguir un vector con
También lo podemos obtener con sapply
.