eIF6-rRNA sarcin-ricin loop complex

Universitat de València - Grado en Química
Prácticas de Bioquímica

P1 - Representación y Análisis de Estructuras de Macromoléculas

Actualizado:


Introducción

Bases de Datos de Estructuras Experimentales

Métodos de Determinación Experimental de Estructuras de Proteínas

Determinación Experimental de Estructuras de Proteínas

En la actualidad se conocen con detalle atómico mas de 225,000 estructuras tridimensionales de macromoléculas biológicas. Cada una de ellas ha sido determinada experimentalmente, utilizando distintos métodos, principalmente Difracción de Rayos-X (~90% de los casos), Resonancia magnética Nuclear (RMN) (~9% de los casos), y en menor medida (~1%), Microscopía Electrónica y otras técnicas de difracción.

Toda esta enorme información está disponible de forma libre para la enseñanza, la investigación, la sanidad o la industria. Para su difusión se utilizan ficheros de texto en los cuales se escriben las coordenadas de los átomos que componen la molécula utilizando un formato estandarizado (formato pdb). A cada estructura se le asigna un código único de identificación (PDB ID) y todo ello se deposita y organiza en un archivo accesible sin restricciones a través de Internet.

El archivo de estructuras 3D experimentales de bio-macromoléculas es único. Por razones históricas recibe el nombre de Protein Data Bank (PDB), aunque también contiene estructuras de DNA, RNA y otras macromoléculas de composición mixta. A nivel mundial es gestionado a través del consorcio wwPDB que organiza el deposito de nuevas estructuras a la vez que mantiene una copia completa y actualizada del archivo, accesible a través de las bases de datos RCSB PDB, PDBe-KB y PDBj.

Las bases de datos facilitan el acceso a la información estructural a través de herramientas de búsqueda. Además, proporcionan información estadística sobre el contenido del archivo e información bibliográfica sobre cada registro y complementan la información estructural depositada por los autores con una amplia gama de datos obtenidos a partir del análisis de las estructuras, tales como:

Nota Importante


Las estructuras de macromoléculas también pueden predecirse mediante métodos de cálculo y algoritmos informáticos (Computed Structure Models - CSM). Aunque desde Julio de 2022 RCSB PDB facilita al acceso a estructuras CSM obtenidas mediante algoritmos AI / Machine Learning, estas forman parte de achivos de datos externos, como AlphaFold-DB y ModelArchive. No debes confundir las estructuras experimentales del archivo PDB (icono ) con modelos estructurales de predicciones, de archivos CSM (icono ).

Representación y Análisis de Estructuras

Las estructuras moleculares corresponden a una escala nanométrica (10-9 m) por lo que no pueden ser observadas directamente con resolución atómica: La resolución de la microscopía óptica se encuentra limitada por el rango de valores de longitud de onda de la luz visible (centenas de nm). Tampoco es fácil observar moléculas con detalle atómico mediante microscopías electrónica - EM o de fuerza atómica - AFM. Por todo ello, para su estudio, las estructuras moleculares se representan o recrean gráficamente a partir de las coordenadas de los átomos que componen la molécula, con ayuda de programas informáticos. Dichas representaciones son modelos moleculares tridimensionales que pueden ser rotados, anotados y re-escalados y además permiten el estudio de propiedades moleculares, tanto geométricas (distancias, ángulos, rotámeros, superficies, volúmenes) como químicas (hidrofobicidad / polaridad).

Existe una gran variedad de programas informáticos adecuados para llevar a cabo representaciones de macromoléculas biológicas. En general, pueden clasificarse en:

  1. Programas de visualización molecular. Permiten una exploración rápida de la molécula a través de distintos modos de ilustración. Se integran fácilmente en sitios web, aunque su capacidad gráfica y de análisis molecular es limitada. Dos ejemplos de uso muy extendido son Jmol, NGL Viewer y Mol*.
  2. Programas de análisis y modelización molecular. Permiten una visualización acoplada a herramientas especializadas de análisis de la estructura. Presentan una alta calidad gráfica y multiples posibilidades que pueden expandirse mediante el uso de scripts y plugins. Dos buenos ejemplos de este tipo son PyMol y VMD.

Resumen del Desarrollo de la Práctica

En la Parte 1 "visitaremos" la base de datos RCSB PDB y revisaremos brevemente el tipo de información que proporciona. Tomaremos un ejemplo concreto de estructura de una proteína, estudiaremos de manera general sus características y analizaremos el contenido de sus ficheros estructurales en formatos PDB y FASTA.

En la Parte 2 representaremos la estructura elegida en la Parte 1 con la ayuda de un programa informático sencillo accesible desde de la propia base de datos. Visualizaremos la molécula en sus distintos niveles de estructura y observaremos detalles de sus sitio de unión de ligandos.

Objetivos

  1. Conocer la base de datos de estructuras tridimensionales de macromoléculas biológicas.
  2. Llevar a cabo búsquedas y acceder a información estructural concreta.
  3. Llevar a cabo representaciones de la estructura de una proteína y estudiar sus características a través de modelos moleculares.



J. Salgado - 2020, Universitat de València    Creative Commons Licence