jueves, 11 de mayo de 2023

EL FIN DE LA REALIDAD: La nueva inteligencia artificial que creará la sociedad del engaño



(Pexels - Gary-Barnes)


Una nueva IA es capaz de tomar tus fotos y las de tus contactos y poneros en cualquier situación que se te ocurra. Una ‘app’ aparentemente divertida que puede crear muchos problemas




Imagina tener una aplicación en tu móvil que te permite generar coartadas perfectas que cubran tus engaños. Con ella podrías crear imágenes que le demuestren a tu jefe que estabas convaleciente en la cama en lugar de en la piscina o mostrarle una foto a tu pareja jugando al pádel con tus amigas cuando en realidad estabas en la cama con otra persona. Pues esa aplicación ya existe, se llama Hotspot y usa inteligencia artificial generativa para crear fotos tuyas y de quién tú quieras realizando cualquier actividad que se te pase por la cabeza.

"Imagina que Midjourney supiera cómo son tus amigos... Presentamos Hotshot!", tuiteó Aakash Sastry, uno de los creadores de Hotspot. "Haz fotos con CUALQUIERA DE TUS CONTACTOS haciendo CUALQUIER COSA".

Evidentemente, Natural Synthetics Inc., la compañía detrás de este ‘software’, no lo vende como una herramienta para engañar a nadie, sino como una manera de hacer memes divertidos de tus amigos fácilmente. Sin embargo, su uso real puede ser mucho más perverso y se puede emplear tanto para el engaño como para crear imágenes comprometedoras de gente que desemboquen en situaciones de acoso o chantaje.



Hotspot no requiere ningún consentimiento por parte de la otra persona para poder usar sus imágenes, lo que puede abrir todo un abanico de problemas éticos y legales. De momento esta IA todavía no es capaz de cumplir todo lo que promete, pero es cuestión de tiempo que aparezca una nueva versión que la mejore y que genere imágenes totalmente indistinguibles de una foto real.


Cómo funciona

Por el momento la ‘app’ solo funciona para iPhone. Y cómo explica la compañía en su página de la App Store de Apple, sólo tienes que escanear tu cara para registrarte. Después, se supone que en cuestión de minutos Hotshot aprende cómo es tu aspecto, algo que puedes replicar añadiendo fotos de tus contactos. Una vez subidas las imágenes de los protagonistas hay que teclear cualquier situación que se te ocurra en el campo de texto y el sistema genera fotos de ti y tus amigos en ese contexto.

Sin embargo, las pruebas que hemos hecho nosotros no han funcionado demasiado bien, por lo menos no tan bien como dice Sastry. La imagen es fotorrealista y recrea bien los escenarios que le planteas, pero las caras no están bien conseguidas. Aunque tienen elementos que les hacen parecerse a los rostros originales, todavía están lejos de engañar a nadie. Eso sí, los resultados van mejorando con el uso y los creadores de Hotspot aseguran que la calidad será mayor cuanto más usuarios la empleen.

Ni Aakash ni Natural Synthetics han contado demasiado sobre la inteligencia artificial generativa que hay detrás de Hotspot, pero probablemente se trate de Stable Diffusion, una IA de código abierto y gratuita que permite su integración en otras plataformas. Las primeras versiones de Stable Diffusion tenían los mismos errores que muestra Hotspot, con imágenes demasiado estilizadas, como si les hubieran pintado con un aerógrafo que las suaviza, y problemas para dibujar las manos en sus proporciones correctas.
Hasta que llegue la siguiente generación

Como explicamos en el episodio de Control Z: ‘El Fin de la Realidad’ tanto las fotos como los vídeos (ya sean grabados o en vivo, como las videoconferencias), dejarán de ser en poco tiempo una prueba documental fiable ante nadie. Esta tecnología se puede usar para el bien —algunos dicen que es el salto creativo más grande que ha dado la humanidad desde el siglo XIX— o para el mal, creando imágenes que sirvan para inculpar a un inocente de un crimen o para mostrar situaciones inventadas con las que acosar a adolescentes en el instituto.



Las nuevas versiones de inteligencias artificiales generativas como Midjourney o Stable Diffusion ya son capaces de convertir texto en imágenes de un fotorrealismo extraordinario. Ahora mismo ya es prácticamente imposible distinguir las fotos generadas por IA de las reales.

Las IAs que generan vídeo a partir de texto van un poco más retrasadas y las nuevas versiones de programas como Runway no han alcanzado todavía el realismo de los de foto. Los expertos que consultamos para producir 'El Fin de la Realidad', auguraban que en 10 años seríamos capaces de crear películas como las de Hollywood desde nuestro ordenador casero, aunque esas previsiones de tiempo no paran de recortarse.

placeholderAnderson y Graham charlan mientras, en tiempo real, la cara de Graham es sustituida por la Anderson. (Gilberto Tadday / TED)
Anderson y Graham charlan mientras, en tiempo real, la cara de Graham es sustituida por la Anderson. (Gilberto Tadday / TED)

Uno de los expertos consultados fue Tom Graham, CEO de Metaphysic, una de las empresas más punteras en inteligencia artificial generativa del planeta y creador del famoso ‘deepfake’ de Tom Cruise en TikTok o el Elvis resucitado que gana America's Got Talent. Graham participó recientemente en una entrevista para TED con su fundador, Chris Anderson, que tuvo lugar en el gran escenario del Centro de Convenciones de Vancouver, Canadá.

"Parece que vamos a tener que acostumbrarnos a un mundo en el que ni nosotros ni nuestros hijos podremos confiar en la evidencia de nuestros ojos", dijo Gaham mientras su rostro se transformaba en el de Anderson en tiempo real. El contraste entre sus palabras y lo que estaba pasando en el escenario fue impactante y nos demuestra que crear video indistinguible de la realidad en directo también es ya posible.