2024-04-03
1. Elegir un experimento con microarrays bien de GEO bien de ArrayExpress.
El estudio elegido para el análisis proviene de GEO, y su identificador es GSE124593. En el se busca estudiar las diferencias transcriptomicas entre los tumores mamarios primarios y los recurrentes. Existe evidencia de que estos tipos de tumores existen diferencias que provocan unas respuestas a tratamiento distintas, por lo que con este estudio se pretende caracterizar las diferencias entre estas dos formas de tumor mamario, para asi poder llegar a individualizar los tratamientos de estos dos tipos. Los resultados de este estudio se comentaron en un articulo publicado en Julio de 2020, cuyo PMID es 31988496.
Para este estudio se trabajo modelos murinos MTB/TAN (Mus musculus), que desarrollan cancer de mama por la via del Her2. Las muestras analizadas provienen de tumores de mama primarios y recurrentes, habiendo 2 muestras provenientes de tumores primario, con 2 replicas cada una y otras 2 de tumores recurrentes, con 2 replicas cada una, es decir, el estudio cuenta en total con 8 muestras. El experimento pertenece a un array de Affymetrix, más concretamente de la plataforma Affymetrix Mouse Genome 430A 2.0 Array.
La descarga de los datos, así como su conversión a Affy Bach, se realiza de la siguiente manera:
El siguiente chunk permite cargar el archivo con los datos crudos en formato Affy Bach sin necesidad de volver a descargar los datos.
2. Realizar un estudio sobre la calidad de las muestras. Este estudio ha de incluir:
3. Preprocesar los datos con el procedimiento RMA.
4. Repetir los tres primeros apartados del apartado 2 con los nuevos datos.
Este grafico tambien ser puede realizar mediante el paquete ggplot con el siguiente chunk
5. En este ExpressionSet hay que incluir:
Toda esta anotacion se puede realizar a la vez mediante el siguiente chunk. Para ello, se precisa de la instalacion del paquete de la base de datos con la que se ha anotado el ExpressionSet (mouse430a2.db), esto se asegura cargando el paquete con pacman, ya que si no está instalado, lo instala automaticamente.
Ambos análisis se realizarán comparando los datos con la base de datos de Gene Ontology, en concreto con los términos relacionados con procesos biológicos. Para ello, primero construimos esta colección GO para el organismo Mus musculus con el paquete EnrichmentBrowser
.