Universitat de València - Grado en Bioqímica y Ciencias Biomédicas
Estructura de Macromoléculas y Enzimología
P1 - Representación y Análisis de Estructuras de Macromoléculas
Determinación Experimental de Estructuras de Proteínas
En la actualidad se conocen con detalle atómico mas de 225,000 estructuras tridimensionales de macromoléculas biológicas. Cada una de ellas ha sido determinada experimentalmente, utilizando distintos métodos, principalmente Difracción de Rayos-X (~90% de los casos), Resonancia magnética Nuclear (RMN) (~9% de los casos), y en menor medida (~1%), Microscopía Electrónica y otras técnicas de difracción.
Toda esta enorme información está disponible de forma libre para la enseñanza, la investigación, la sanidad o la industria. Para su difusión se utilizan ficheros de texto en los cuales se escriben las coordenadas de los átomos que componen la molécula utilizando un formato estandarizado (formato pdb). A cada estructura se le asigna un código único de identificación (PDB ID) y todo ello se deposita y organiza en un archivo accesible sin restricciones a través de Internet.
El archivo de estructuras 3D experimentales de bio-macromoléculas es único. Por razones históricas recibe el nombre de Protein Data Bank (PDB), aunque también contiene estructuras de DNA, RNA y otras macromoléculas de composición mixta. A nivel mundial es gestionado a través del consorcio wwPDB que organiza el deposito de nuevas estructuras a la vez que mantiene una copia completa y actualizada del archivo, accesible a través de las bases de datos RCSB PDB, PDBe-KB y PDBj.
Las bases de datos facilitan el acceso a la información estructural a través de herramientas de búsqueda. Además, proporcionan información estadística sobre el contenido del archivo e información bibliográfica sobre cada registro y complementan la información estructural depositada por los autores con una amplia gama de datos obtenidos a partir del análisis de las estructuras, tales como:
Las estructuras de macromoléculas también pueden predecirse mediante métodos de cálculo y programas informáticos (Computed Structure Models - CSM). Aunque desde Julio de 2022 RCSB PDB facilita al acceso a estructuras CSM obtenidas mediante algoritmos de tipo AI / Machine Learning, estas forman parte de achivos de datos externos, como AlphaFold-DB y ModelArchive. No debes confundir las estructuras experimentales del archivo PDB (icono ) con modelos estructurales de predicciones, de archivos CSM (icono
).
Las estructuras moleculares corresponden a una escala nanométrica (10-9 m) por lo que no pueden ser observadas directamente con resolución atómica: La resolución de la microscopía óptica se encuentra limitada por el rango de valores de longitud de onda de la luz visible (400 - 700 nm) y su máxima resolución alcanzable es ~200 nm (límite de difracción de Abbe). Otros métodos de tipo nanoscópico, como las microscopías electrónica - EM o de fuerza atómica - AFM permiten observar moléculas, aunque no de manera directa. Por todo ello, para su estudio, las estructuras moleculares se representan o recrean gráficamente a partir de las coordenadas de los átomos que componen la molécula, con ayuda de programas informáticos. Dichas representaciones son modelos moleculares tridimensionales que pueden ser rotados, anotados y re-escalados y además permiten el estudio de propiedades moleculares, tanto geométricas (distancias, ángulos, rotámeros, superficies, volúmenes) como químicas (hidrofobicidad / polaridad).
Existe una gran variedad de programas informáticos adecualdos para llevar a cabo representaciones de macromoléculas biológicas. En general, pueden clasificarse en:
En la Parte 1 "visitaremos" la base de datos RCSB PDB y revisaremos brevemente el tipo de información que proporciona. Tomaremos un ejemplo concreto de estructura de una proteína, estudiaremos de manera general sus características y analizaremos el contenido de sus ficheros estructurales en formatos PDB y FASTA.
En la Parte 2 representaremos la estructura elegida en la Parte 1 con la ayuda de un programa informático sencillo accesible desde de la propia base de datos. Visualizaremos la molécula en sus distintos niveles de estructura y observaremos detalles de sus sitio de unión de ligandos.