Uno de los mayores misterios de la biología ha sido resuelto "casi al completo" utilizando inteligencia artificial.
Predecir cómo una proteína adquiere una forma tridimensional única ha desconcertado a los científicos durante medio siglo.
Pero el laboratorio de inteligencia artificial DeepMind, ubicado en Londres, ha resuelto la parte más compleja del problema, aseguran los organizadores de un desafío científico.
Una mejor comprensión de las formas de las proteínas podría desempeñar un papel fundamental en el desarrollo de nuevos fármacos para tratar enfermedades.
Se espera que el avance del DeepMind acelere la investigación de una serie de enfermedades, incluida la covid-19.
Su programa determinó la forma de las proteínas con un nivel de precisión comparable a los costosos y lentos métodos de laboratorio, aseguran los expertos.
El doctor Andriy Kryshtafovych, de la Universidad de California (UC) en Davis y uno de los miembros del panel de científicos que analizó los hallazgos, describió el logro como "verdaderamente notable".
"Ser capaz de investigar la forma de las proteínas de forma rápida y precisa tiene el potencial de revolucionar las ciencias de la vida", dijo.
¿Qué son las proteínas?
Las proteínas están presentes en todos los seres vivos y desempeñan un papel central en los procesos químicos esenciales para la vida.
Están compuestos por cadenas de aminoácidos y se erigen en estructuras de infinitas formas muy elaboradas, las cuales contienen la clave de cómo llevan a cabo sus funciones vitales.
Muchas enfermedades están relacionadas con el papel de las proteínas en la catalización de reacciones químicas (enzimas). Pero también con la lucha contra enfermedades (anticuerpos), o actuando como mensajeros químicos (como la insulina).
"Incluso pequeños reordenamientos de estas moléculas fundamentales pueden tener efectos catastróficos en nuestra salud, por lo que una de las formas más eficientes de comprender una enfermedad y encontrar nuevos tratamientos es estudiar las proteínas participantes", dijo el doctor John Moult, de la Universidad de Maryland y presidente del panel de científicos.
"Hay decenas de miles de proteínas humanas y muchos miles de millones en otras especies, incluidas bacterias y virus, pero trabajar la forma de una sola requiere equipos costosos y puede llevar años".
¿Cómo fue el desafío científico?
En 1972, Christian Anfinsen fue galardonado con un premio Nobel por su trabajo que demuestra que es posible determinar la forma de las proteínas basándose en la secuencia de sus componentes básicos de aminoácidos.
Cada dos años, decenas de equipos de más de 20 países usan computadoras para intentar predecir la forma de un conjunto de alrededor de 100 proteínas a partir de sus secuencias de aminoácidos.
Al mismo tiempo, los biólogos elaboran las estructuras tridimensionales en el laboratorio utilizando técnicas tradicionales como la cristalografía de rayos X y la espectroscopia de RMN, que determinan la ubicación de cada átomo en relación con otro en la molécula de proteína.
Un equipo de científicos del CASP (el experimento comunitario sobre la Evaluación Crítica de la Predicción de la Estructura de la Proteína) compara estas predicciones con estructuras en 3-D que ya han sido resueltas usando métodos experimentales.
El CASP utiliza una métrica conocida como prueba de distancia global para evaluar la precisión, que va de 0 a 100.
Una puntuación de alrededor de 90, que logró el programa AlphaFold de DeepMind, se considera comparable con las técnicas de laboratorio.
¿Qué pasó este año?
En la última ronda de este desafío llamada CASP-14, AlphaFold determinó la forma de alrededor de dos tercios de las proteínas con una precisión comparable a la de las pruebas de laboratorio.
Los evaluadores dijeron que la precisión con la mayoría de las otras proteínas también era alta, aunque no a ese nivel.
AlphaFold se basa en un concepto llamado aprendizaje profundo. En este proceso, la estructura de una proteína formada se representa como un gráfico espacial.
Luego, el programa "aprende" utilizando información sobre las formas tridimensionales de proteínas conocidas que se encuentran en la base de datos pública de proteínas.
El programa de inteligencia artificial pudo hacer en cuestión de días lo que podría llevar años en el laboratorio.
¿Cómo se utilizará esta información?
Conocer la estructura tridimensional de una proteína es importante en el diseño de fármacos y en la comprensión de las enfermedades humanas, como el cáncer, la demencia y las enfermedades infecciosas.
Un ejemplo es la covid-19, en la cual los científicos han estado estudiando cómo la proteína espiga (spike) en la superficie del virus Sars-CoV-2 interactúa con los receptores en las células humanas.
El profesor Andrew Martin, del University College London (UCL), explica a la BBC: "Comprender cómo una secuencia de proteínas se estructura en tres dimensiones es realmente una de las cuestiones fundamentales de la biología".
"La forma en que funciona una proteína depende de su estructura tridimensional. Y la función de la proteína es relevante para todo en la salud y las enfermedades. Al conocer las estructuras tridimensionales de las proteínas, podemos ayudar al diseño de medicamentos e intervenir en problemas de salud, ya sean infecciones o enfermedades hereditarias".
La profesora Dame Janet Thornton, del Instituto Europeo de Bioinformática, dijo que cómo las proteínas crean "estructuras tridimensionales exquisitamente únicas", es uno de los mayores misterios de la biología.
"Una mejor comprensión de las estructuras de las proteínas y la capacidad de predecirlas usando una computadora significa una mejor comprensión de la vida, la evolución y, por supuesto, la salud y las enfermedades humanas", explicó.
¿Qué viene ahora?
Ahora otros científicos analizarán los datos para determinar qué tan preciso es el método de inteligencia artificial y qué tan bien funciona a un nivel más detallado.
Todavía queda una brecha de conocimiento, que incluye averiguar cómo se unen varias proteínas y cómo las proteínas interactúan con otras moléculas, como el ADN y el ARN.
El doctor Kryshtafovych explica: "Ahora que el problema se ha resuelto en buena medida para las proteínas individuales, queda abierto el camino para el desarrollo de nuevos métodos para determinar la forma de los complejos de proteínas: colecciones de proteínas que trabajan juntas para formar gran parte de la maquinaria de la vida. Y para otras aplicaciones también".
Helen Briggs
BBC
1 diciembre 2020, 01:16 GMT