Las cadenas de aminoácidos de cada proteína se pliegan en una estructura tridimensional única. Y esa forma determina su función en el cuerpo humano. KAREN ARNOTT
La inteligencia artificial fue utilizada para predecir las estructuras de casi todas las proteínas producidas por el cuerpo humano, según un nuevo estudio.
El avance podría impulsar el descubrimiento de nuevos medicamentos para tratar enfermedades, además de otras aplicaciones.
Las proteínas son componentes esenciales de los organismos vivos. Cada una de nuestras células está repleta de estos "ladrillos esenciales" de la vida.
Comprender las formas de las proteínas es fundamental para el avance de la medicina, pero hasta ahora solo se había logrado dilucidar la estructura de una fracción de ellas.
Ahora los investigadores utilizaron un programa llamado AlphaFold para predecir las estructuras de 350.000 proteínas de humanos y de otros organismos.
Las instrucciones para producir proteínas humanas están contenidas en nuestros genomas, el ADN en los núcleos de las células humanas.
Hay alrededor de 20.000 de estas proteínas expresadas por el genoma humano.
En conjunto, los biólogos se refieren a el conjunto completo de estas proteínas como el "proteoma".
"Creemos que es la imagen más completa y precisa del proteoma humano hasta la fecha", señaló Demis Hassabis, director ejecutivo y cofundador de la empresa de inteligencia artificial DeepMind, que desarrolló AlphaFold.
"Pensamos que este trabajo representa la contribución más significativa de la inteligencia artificial al avance del conocimiento científico hasta la fecha".
"Y creo que es una gran ilustración y ejemplo del tipo de beneficios que la inteligencia artificial puede aportar a la sociedad".
"Estamos muy emocionados de ver qué va a hacer la comunidad científica con esta información", agregó Hassabis.
Las proteínas están formadas por cadenas de bloques de construcción más pequeños llamados aminoácidos.
Estas cadenas se pliegan de innumerables formas diferentes, formando una forma 3D única. La forma o plegamiento de una proteína determina su función en el cuerpo humano.
Las 350.000 estructuras de proteínas que predijo AlphaFold incluyen no solo las 20.000 contenidas en el proteoma humano, sino también las de los llamados organismos modelo utilizados frecuentemente en la investigación científica, como la bacteria E. coli, la levadura, la mosca de la fruta y los ratones.
Este salto gigante en capacidad está descrito en un nuevo estudio de investigadores de DeepMind y del Laboratorio Europeo de Biología Molecular (EMBL, por sus siglas en inglés) que fue publicado en la prestigiosa revista Nature.
AlphaFold pudo hacer una predicción segura de los plegamientos para el 58% de los aminoácidos en el proteoma humano.
Las posiciones del 35,7% se predijeron con un grado de confianza muy alto, el doble del número confirmado por experimentos.
Las técnicas tradicionales para dilucidar estructuras de proteínas incluyen la cristalografía de rayos X y la criomicroscopía electrónica (Cryo-EM por sus siglas en inglés), entre otras.
Pero ninguno de estos métodos es sencillo.
"Se necesita una gran cantidad de dinero y recursos para descifrar las estructuras", le señaló a la BBC el profesor John McGeehan, biólogo estructural de la Universidad de Portsmouth, en Inglaterra.
Debido a esas dificultades, las formas 3D a menudo se obtienen como parte de investigaciones científicas específicas, pero ningún proyecto hasta ahora había determinado de forma sistemática estructuras para todas las proteínas producidas por el cuerpo.
De hecho, solo las estructuras del 17% del proteoma humano han sido confirmadas experimentalmente.
"Es la velocidad, el hecho de que nos tomó seis meses por estructura y ahora toma un par de minutos. Realmente no podríamos haber predicho que sucedería tan rápido", afirmó el profesor McGeehan sobre las predicciones de AlphaFold.
"Cuando enviamos siete secuencias para predecir al equipo de DeepMind, ya habíamos logrado descifrar experimentalmente las estructuras de dos de ellas. Así que pudimos compararlas con los resultados de Deep Mind. Fue uno de esos momentos, para ser honesto, donde se te ponen los pelos de punta detrás de tu cuello. Las estructuras de AlphaFold y las que habíamos confirmado experimentalmente eran idénticas".
La profesora Edith Heard, de EMBL, señaló que este avance "transformará lo que sabemos del funcionamiento de la vida. Eso se debe a que las proteínas representan los bloques de construcción fundamentales a partir de los cuales están hechos los organismos vivos".
"Las aplicaciones están limitadas únicamente por nuestro entendimiento".
Esas aplicaciones posibles incluyen nuevos tratamientos para enfermedades, cultivos resistentes al cambio climático y enzimas que puedan descomponer el plástico que contamina el medio ambiente.
El grupo del profesor McGeehan ya está utilizando los datos de AlphaFold para desarrollar enzimas más rápidas para degradar el plástico.
McGeehan señaló que la inteligencia artificial había proporcionado predicciones para proteínas cuyas estructuras no se pudieron determinar experimentalmente, lo que ayudó a acelerar su proyecto en "varios años".
Ewan Birney, director del Instituto Europeo de Bioinformática de EMBL, le dijo a la BBC que las estructuras que predijo AlphaFold son "una de las bases de datos más importantes desde el mapa del genoma humano".
DeepMind se asoció con EMBL para hacer que las predicciones de los plegamientos de las proteínas de AlphaFold estén disponibles abiertamente para la comunidad científica mundial.
Hassabis señaló que DeepMind planea expandir su base de datos para incluir a casi todas las proteínas secuenciadas conocidas por la ciencia: más de 100 millones de estructuras.
- Paul Rincon
- Editor de Ciencia de BBC News