Bioquímica P1: Representación y Análisis de Estructuras de Macromoléculas

Como se ha descrito en la Introducción, la organización internacional wwPDB mantiene un repositorio único de estructuras de macromoléculas obtenidas experimentalmente. Vamos a consultar esa información a través del sitio gestionado por el RCSB (Research Collaboratory for Structural Bioinformatics), cuya base de datos se denomina RCSB PDB.

En esta primera parte conocerás la base de datos y utilizarás alguna de sus herramientas para estudiar estructuras de proteínas.

Es obligatorio entregar el formulario de resultados individualmente, en pdf, a través de la Tarea correspondiente de Aula Virtual

➀ Vista general del archivo

Accede a RCSB PDB y revisa su contenido

En la página inicial encontrarás un campo para realizar búsquedas (campo Enter search term(s)) y un menú principal con distintos tabuladores, que también puedes encontrar en la parte superior.

Los tab→ Welcome y Learn contienen información general. Los tab→ Deposit y Analyze son utilizados por usuarios avanzados. Permiten insertar nuevas estructuras de moléculas, analizar su calidad o comparar distintas estructuras. Entrando en el tab→ Search podemos navegar a través del archivo y localizar estructuras individuales o por tipos. Por último, en el tab→ Visualize encontrarás herramientas sencillas para crear y observar modelos gráficos de estructuras.

Explora

Empieza por revisar brevemente la información disponible en la base de datos. Para ello selecciona el tab→ Search (apartado→ PDB Statistics) y averigua:

¿Cuáles son los organismos cuyas moléculas se encuentran más representadas en la base de datos?
¿Qué métodos experimentales se han utilizado para determinar las estructuras de la base de datos?
A pesar del nombre de la base de datos, no todas las estructuras depositadas en ella son proteínas. ¿Qué tipos de moléculas (Polymer Type) hay en la base de datos?

➁ Busca y revisa estructuras concretas

Moléculas del Mes

Cada mes la base de datos selecciona una molécula "estrella" (Molecule of the Month), la cual se accede facilmente desde la página inicial de RCSB-PDB. Utilizaremos la molécula destacada este mes como primer ejemplo de estructuras interesantes de proteínas. Accederás a un breve artículo sobre esa molécula que explica cómo es y qué función tiene a través de sus estructuras presentes en la base de datos. Cuando el texto de ese artículo comenta sobre una estructura, menciona también su identificador en la base de datos (PDB ID), al cual asocia un link que te permite llegar con un solo click al registro de la estructura, donde podrás encontrar todos los detalles sobre ella.

NOTA: Todas las Moléculas de meses anteriores se encontran através del tab→ Learn (link→ Molecule of the Month)

Explora

Selecciona el link de la molécula de este mes (selecciona la imagen de Molecule of the Month). Lee la página sobre esta molécula y responde:

¿Cuál es el nombre de la molécula (o sistema, o tipo de moléculas) que ha sido destadada este mes? ¿Cuál es su función, o para qué se utiliza?
El artículo comenta varias estructuras y de cada una menciona su correspondiente PDB ID ¿Cuáles son los PDB ID que aparecen en el artículo de la molécula de este mes? ¿En qué consisten (brevemente) o a qué moéculas corresponden esas estructuras?

Oxi-hemoglobina humana

Vamos a trabajar el resto de la práctica con la estructura de una proteína que seguramente ya conoces: la hemoglobina. Un pequeño problema es que la base de datos contiene muchas estructuras de esta molécula. Buscaremos una de origen humano, que contenga oxígeno unido (oxi-hemoglobina) y que haya sido determinada con una alto nivel de resolución (al menos 1.3 Å). Para ello vamos a utilizar la herramienta de búsqueda avanzada.

Explora

Selecciona el tab→ Search y después → Advanced Search.

Comenzaremos buscando human hemoglobin. Para ello, en el apartado Structure Attributes abre el Menú desplegable y selecciona Structure Details→ Structure Title.
Verás que el número de estructuras que encuentra es muy grande. Todas ellas corresponden a hemoglobina humana, pero han sido investigadas con distintos ligandos, en disintas condiciones..., etc.

Añade ahora un nuevo campo de búsqueda (Add Attribute) y en su Menú desplegable selecciona Methods→ Refinement Resolution, añadiendo la condición < 1.3:

¿Cuántas estructuras de hemoblobina humana hay en la base de datos?
Debes haber encontrado una única estructura de oxi-hemoglobina humana con una resolución < 1.3 ¿Con qué método ha sido determinada esa estructura? Anota su PDB ID.

➂ Información en un registro estructural

Entra en el registro de la estructura de la oxi-hemoglobina humana que has encontrado en el apartado anterior (selecciona el link de su PDB ID). Al acceder al registro encontrarás información resumida sobre esa estructura, incluyendo información técnica sobre su calidad, información bibliográfica (Literature) y detalles sobre las moléculas que contiene. Entre esto último verás que distingue entre Macromolecules (cadenas proteicas) y Small Molecules. Estas últimas son las que se encuentran unidas a las cadenas de proteína (es decir, ligandos de la proteína).

Explora

Examina el registro de la oxi-hemoglobina humana que has encontrado . Busca información para responder a las siguientes preguntas:

¿Cuántas cadenas de proteína (Macromolecules) existen en la estructura? ¿Cómo se denomina cada una de ellas? ¿Cuál es la longitud, en número de residuos de cada cadena?
¿Cuáles son las moléculas ligando (Small Molecules) presentes en la estructura?

➃ Ficheros de datos estructurales. Formatos FASTA y PDB

Información estructural en el formato PDB. Las columnas que contienen las tres coordenadas cartesianas dictan la posición espacial puntual de cada átomo. El número de ocupación se refiere a la frecuencia de cada posición espacial entre varias conformaciones posibles en la estructura y el factor B (factor isotrópico de temperatura) indica el desplazamiento de la posición del átomo con respecto a un valor medio.

Las estructuras de la base de datos están escritas en ficheros sencillos de texto con formatos especiales. Cuando accedemos a un registro, sus ficheros estructurales se pueden obtener a través del menú desplegable <Display Files>.

Entre los ficheros estructurales de cada registro los mas útiles y sencillos de entender corresponden a los formatos FASTA y PDB.

El fichero FASTA describe la se encuentra estructura primaria (secuencia de residuos) de la molécula. Si en la estructura existen varias cadenas poliméricas, cada una de ellas corresponde a una línea continua en el fichero, sin espacios, con excepción de las líneas que comienzan por >, que contienen comentarios.

El fichero PDB describe la estructura tridimensional de la molécula escrita a través de las coordenadas espaciales o cartesianas {x,y,z} de sus átomos pesados (C, O, N, S, P u otros, si los hay, pero no H). En los ficheros PDB suele haber una primera parte, denominada HEADER con información complementaria (autores, origen de la proteína, método usado, calidad de la estructura, secuencia de residuos, etc). La información estructural se encuentra a continuación y corresponde a todas las líneas que comienzan por ATOM. Si existen grupos químicos no proteicos en la molécula, su estructura se escribe en las lineas que comienzan por HETATM. En los casos en los que aparece información en líneas marcadas con ANISOU, esta corresponde a los factores de temperatura anisotrópicos de cada átomo, (desplazamiento de la posición del átomo con respecto a su posición media) que proporcionan información acerca de la flexibilidad de la molécula.

Explora

Despliega el menú <Display Files> del registro que acabas de encontrar. Selecciona el fichero FASTA Sequence y observa su contenido. Después abre el fichero PDB Format y navega hacia abajo observando su contenido.

¿Qué código se utiliza para definir la secuencia de residuos en el formato FASTA?
¿Cuántas cadenas aparecen en el fichero FASTA de esta estructura? ¿Cómo se nombran esas cadenas? Compara esas cadenas, ¿son idénticas o diferentes?
Anota los 4 primeros residuos de cada cadena
¿Qué líneas de información del fichero PDB son imprescindibles para definir la estructura de la molécula?
¿A qué moléculas o grupos químicos corresponden los átomos no proteicos presentes en esta estructura?
¿Cuántas cadenas hay en el fichero? Anota los 4 primeros residuos de cada una de ellas y compáralos con los 4 primeros residuos de la secuencia en el formato FASTA.
NOTA: El primer residuo de la secuencia (en FASTA) no está presente en el fichero de coordenadas (pdb). La explicación a esta aparente contradicción está en el REMARK 465 del fichero pdb

Parte 1

Bases de Datos del wwPDB

➀ Vista general del archivo

Accede a RCSB PDB y revisa su contenido

Explora

➁ Busca y revisa estructuras concretas

Moléculas del Mes

Explora

Oxi-hemoglobina humana

Explora

➂ Información en un registro estructural

Explora

➃ Ficheros de datos estructurales. Formatos FASTA y PDB

Explora