El conocimiento de los virus se ha convertido en algo verdaderamente avanzado gracias a la IA
La inteligencia artificial ha revolucionado la exploración y descubrimiento de virus en el que ya es el mayor logro científico de su corta historia, especialmente de los virus de ARN. Gracias a herramientas avanzadas de aprendizaje profundo, como el modelo LucaProt, se han identificado más de 160,000 especies potenciales de virus de ARN en diversos ecosistemas, lo que mejora de forma impresionante nuestro conocimiento sobre la diversidad viral en el planeta.
Este descubrimiento no hace otra cosa que demostrar la capacidad de la IA para encontrar patrones en datos complejos y detectar especies virales que hasta ahora permanecían ocultas, muchas de las cuales no se identificaban con métodos tradicionales debido a su alta divergencia genética. Esto ya se pudo comprobar en la lucha contra el cáncer, concretamente a la hora de aislar las células cancerígenas.
Un avance fundamental
Los virus de ARN, entidades que contienen ácido ribonucleico en lugar de ADN como material genético, destacan por su gran variabilidad genética y capacidad de adaptación, lo que los hace demasiado pertinaces a la hora de encontrar una forma de pararlos. Sin embargo, esta misma naturaleza dinámica hace que sean difíciles de detectar, ya que muchos presentan secuencias altamente divergentes, es decir, con características genéticas que se desvían considerablemente de los virus conocidos.
Los métodos tradicionales de identificación, que se basan en comparaciones de similitud de secuencias, han resultado insuficientes para captar la diversidad completa de estos virus. La inteligencia artificial ha surgido como una herramienta capaz de superar estas limitaciones, facilitando descubrimientos antes inalcanzables en la investigación virológica. Esto ha quedado de manifiesto en una publicación de científicos chinos en la revista científica Cell.
El modelo LucaProt, utiliza una red neuronal que ha demostrado ser muy eficaz en la identificación de patrones complejos en datos secuenciales como las secuencias de proteínas y genes. Este modelo fue diseñado específicamente para reconocer la polimerasa dependiente de ARN (RdRP), una enzima clave en la replicación de los virus de ARN. Mediante LucaProt, los investigadores han podido explorar un conjunto de datos extenso, compuesto por más de 10.000 metatranscriptomas (fragmentos de secuencias genéticas obtenidas de distintos ecosistemas), lo que ha permitido analizar la diversidad genética de los virus en un nivel sin precedentes.
El uso de IA no solo permite la identificación de secuencias de RdRP en estos virus, sino que también incorpora información estructural de las proteínas virales, lo que mejora la precisión del modelo. Este enfoque ha facilitado la detección de virus que presentan una gran diversidad estructural y genética. Se han encontrado virus en entornos extremos, como aguas termales y respiraderos hidrotermales, lo que demuestra que la diversidad de virus de ARN es incluso mayor de lo que se pensaba, con la presencia de estos microorganismos en ambientes de gran diversidad geológica y climática.
A través de LucaProt, la IA ha revelado cientos de miles de contigs (fragmentos de ADN o ARN ensamblados) que, mediante su análisis, fueron agrupados en más de 180 supergrupos de virus de ARN, algunos de los cuales representan linajes previamente desconocidos. Esto sugiere que hay una "materia oscura" viral, es decir, virus que hasta ahora no habían sido reconocidos por las herramientas convencionales, y que habitan en una variedad de entornos naturales. Los supergrupos identificados fueron comparados con los grupos virales definidos previamente, y se determinó que solo una pequeña parte coincidía con los virus ya clasificados, lo que indica una ampliación de la virosfera a niveles que no se habían anticipado. Sin LucaProt, este proceso habría sido realmente difícil, ya que estaríamos ante un trabajo mucho más manual y humano, haciendo que tardasemos muchísimo más tiempo en efectuarlo.
Un aspecto totalmente clave de esta investigación es que, además de la gran cantidad de virus identificados, la IA permite clasificar estas secuencias en un contexto evolutivo más amplio. Se descubrió que los virus detectados con IA tienen estructuras modulares que reflejan una notable flexibilidad en sus genomas. En algunos casos, los virus de ARN comparten proteínas relacionadas con virus que infectan tanto a bacterias como a eucariotas, lo que sugiere posibles vínculos evolutivos entre virus diferentes.
Esta expansión en la virosfera plantea preguntas sobre los posibles hospedadores de estos virus, dado que hasta ahora se han encontrado principalmente en ambientes naturales con alta diversidad de microorganismos. Es probable que muchos de estos virus estén asociados a huéspedes eucariotas, como hongos o protozoos, que son abundantes en entornos terrestres y acuáticos. Sin embargo, algunos de los nuevos linajes descubiertos también podrían estar asociados con bacterias, lo que apoyaría la teoría de que hay una conexión evolutiva entre los virus de ARN que infectan tanto a eucariotas como a bacterias.
El análisis mediante inteligencia artificial también ha mostrado patrones ecológicos en la distribución de estos virus. Los estudios revelan que ciertos grupos virales predominan en ambientes específicos, como los ecosistemas de agua dulce, los sedimentos marinos y los ambientes extremos, como los manantiales de aguas termales. Estos entornos, en su mayoría inexplorados a nivel microbiano, podrían albergar una rica diversidad de virus, que se relacionan estrechamente con las condiciones físicas y químicas de cada ecosistema.
Este tipo de investigación no solo amplía nuestra comprensión de la diversidad viral en el planeta, sino que también sienta las bases para futuros estudios que exploren las relaciones entre estos virus y sus ecosistemas. La implementación de inteligencia artificial en el campo de la virología ha sido clave, tanto en este como en otros tantos estudios. Si bien, para muchos la IA no es la revolución que se esperaba, es cierto que a nivel de medicina se ha convertido en un aliado increíble.
por Esteban García Marcos
04/11/2024 14:08
https://www.lavanguardia.com/andro4all/ciencia/la-ia-logra-el-mayor-exito-de-su-historia-ha-descubierto-cientos-de-miles-de-nuevos-virus