EME P1: Representación y Análisis de Estructuras de Macromoléculas

Universitat de València - Grado en Bioqímica y Ciencias Biomédicas
Estructura de Macromoléculas y Enzimología

Parte 1

Bases de Datos del wwPDB

Como se ha descrito en la Introducción, la organización internacional wwPDB mantiene un repositorio único de estructuras de macromoléculas obtenidas experimentalmente. Vamos a consultar esa información a través del sitio gestionado por el RCSB (Research Collaboratory for Structural Bioinformatics), cuya base de datos se denomina RCSB PDB.

En esta primera parte conocerás la base de datos y utilizarás alguna de sus herramientas para estudiar estructuras de proteínas.

Es obligatorio entregar el formulario de resultados individualmente, en pdf, a través de la Tarea correspondiente de Aula Virtual

➀ Vista general del archivo

Accede a RCSB PDB y revisa su contenido

En la página inicial encontrarás un campo para realizar búsquedas (campo Enter search term(s)) y un menú lateral principal con distintos tabuladores, que también puedes encontrar en el menú de la parte superior.

Los tab→ Welcome y Learn contienen información general. Los tab→ Deposit y Analyze son utilizados por usuarios avanzados. Permiten insertar nuevas estructuras de moléculas, analizar su calidad o comparar distintas estructuras. Entrando en el tab→ Search podemos navegar a través del archivo y localizar estructuras individuales o por tipos. Por último, en el tab→ Visualize encontrarás herramientas sencillas para crear y observar modelos gráficos de estructuras.

Explora

Empieza por revisar brevemente la información disponible en la base de datos. Para ello selecciona el tab→ Search (apartado→ PDB statistics) y podrás consultar datos sobre la distribución de las estructuras con arregla a diferentes criterios, como el origen de las estructuras según el organismo de procedencia, los tipos de métodos experimentales que se han utilizado para determinar las estructuras de la base de datos, los tipos de moléculas a los cuales corresponden esas estructuras, etc.

➁ Busca y revisa estructuras concretas

Estructuras de hemoglobina

La hemoglobina es una de las proteínas con más estructuras en la base de datos. La primera estructura de hemoglobina fue determinada mediante difracción de rayos X por Max Perutz, galardonado premio Nobel de química (1962) junto a John Kendrew (descubridor de la estructura de la mioglobina mediante el mismo método). Estas estructuras pioneras inauguraron en 1976, junto a otras 10, la primera versión del Protein Data Bank y fueron destacadas como Moleculéculas del Mes en Octubre de 2011.

Quizá te interese saber cuántas otras estructuras de hemoglobina han sido resueltas desde entonces. Vamos a averiguarlo utilizando la herramienta Advanced Search. Entre todas las estructuras que encontremos buscaremos la pionera resuelta por Perutz.

Explora

Selecciona el tab→ Search y después → Advanced Search. Comienza buscando todas las estructuras de hemoglobina:

En el Menú desplegable→ selecciona Polymer Molecular Features→ Macromolecule Name y escribe et término hemoglobin.

Los registros encontrados aparecen listados en la parte inferior de la página. A la izquierda (o al fondo, dependiendo del tamaño de tu pantalla) verás una columna de controles llamada Refinements, que te permite afinar la búsqueda. Por ejemplo, puedes usar la fecha (RELEASE DATE) para encontrar las primeras estructuras de hemoglobina y localizar entre ellas la de Perutz.

¿Cuántas estructuras de hemoblobina hay en la base de datos?
¿Desde qué año se encuentra disponible (released date) la estructura original de Perutz? ¿Cuál es su PDB ID?
¿Qué método se utilizó para determinar esa estructura? ¿Con qué resolución se obtuvo?

➂ Información en un registro estructural

Selecciona el registro de la hemoglobina de Perutz (selecciona el link de su PDB ID). Accederás a una página con información resumida sobre esa estructura, incluyendo datos técnicos sobre su calidad, datos bibliográficos (Literature) y detalles sobre las moléculas que contiene. Entre esto último verás que distingue Macromolecules, es decir, cadenas proteicas, de Small Molecules que se encuentran unidas a las cadenas de proteína (por ejemplo, grupos prostéticos o ligandos de la proteína).

Explora

Examina el registro de la hemoglobina de Perutz. Busca información sobre lo siguiente:

Observa el diagrama de validación ¿Qué dirías sobre la calidad de esta estructura?
¿Cuántas cadenas de proteína (Macromolecules) existen en la estructura? ¿Cómo se denomina cada una de ellas? ¿Cuál es la longitud, en número de residuos de cada cadena?
¿Cuáles son las moléculas no proteicas (Small Molecules) presentes en la estructura?

➃ Ficheros de datos estructurales. Formatos FASTA y PDB

Información estructural en un fichero PDB. Las columnas que contienen las tres coordenadas cartesianas dictan la posición espacial puntual de cada átomo. En las columnas siguientes se encuentran El número de ocupación, que indica la frecuencia de cada posición entre varias conformaciones posibles y el factor B (factor isotrópico de temperatura), que indica el desplazamiento de la posición del átomo con respecto a un valor medio. La información asociada a estos dos últimos números no es necesaria para definir la estructura y se refiere a aspectos relacionados con el desorden y la dinámica de la molécula.

Las estructuras de la base de datos están escritas en ficheros sencillos de texto con formatos especiales. Cuando accedemos a un registro, sus ficheros estructurales se pueden obtener a través del menú desplegable <Display Files>.

El fichero FASTA describe la estructura primaria (secuencia de residuos) de la molécula. Si en la estructura existen varias cadenas poliméricas, cada una de ellas corresponde a una línea continua en el fichero, sin espacios, con excepción de las líneas que comienzan por >, que contienen comentarios.

El fichero PDB describe la estructura tridimensional de la molécula, escrita a través de las coordenadas espaciales o cartesianas {x,y,z} de sus átomos pesados (C, O, N, S, P u otros, si los hay, pero no H). En los ficheros PDB suele haber una primera parte, denominada HEADER con información complementaria (autores, origen de la proteína, método usado, calidad de la estructura, secuencia de residuos, etc). La información estructural se encuentra a continuación y corresponde a todas las líneas que comienzan por ATOM. Si existen grupos químicos no proteicos en la molécula, su estructura se escribe en las lineas que comienzan por HETATM.

Explora

Despliega el menú <Display Files> en la página que corresponde a la hemoglobina de Perutz. Selecciona el fichero FASTA Sequence y observa su contenido. Después abre el fichero PDB Format y navega hacia abajo observando su contenido.

¿Qué código se utiliza para definir la secuencia de residuos en el formato FASTA? ¿Cuál se utiliza en el formato PDB?
¿Cuántas cadenas aparecen en el fichero FASTA de esta estructura? Compara esas cadenas: ¿son idénticas, parecidas o muy diferentes?
¿Qué líneas y qué columnas de información del fichero PDB son imprescindibles para definir la estructura de la molécula (ver pie de la figura)?
¿A qué moléculas o grupos químicos corresponden los átomos no proteicos presentes en esta estructura?
La hemoglobina es tetramérica. Sin embargo, en los ficheros estructurales aparecen solo 2 cadenas ¿Por qué?.