Foto: Reuters
Google acaba de crear MusicLM, una IA que permite componer música de calidad profesional solo con silbar o escribir unas líneas de texto. El programa plantea tantos retos legales que Google ha cerrado su acceso... de momento
Cuando Keunwoo Choi vio lo que Google acababa de crear, no se lo podía creer. Este científico de origen coreano lleva años aplicando la inteligencia artificial (IA) a la música. Primero en Spotify y luego en ByteDance, la firma china dueña de TikTok. "También hago música, por eso cuando probé esta herramienta me quedé sin palabras. Hasta ahora, si componías con una IA, el resultado era como una melodía creada por un niño de 10 años. Esto es casi indistinguible de la música comercial. Diría más, si alguien no me dice antes que lo ha creado una IA, habría dicho que es obra de una persona", explica Choi desde Nueva York a este diario. Bienvenidos a MusicLM, la nueva herramienta creada por Google que, para muchos especialistas, ya es mucho más potente que ChatGPT.
Para entender la fascinación de Choi y otros expertos en IA, basta con escuchar algunas de las melodías creadas por MusicLM. El funcionamiento es sencillo. Escribes un texto, por ejemplo, "en una playa del caribe", "escapando de una prisión", "club de los 60", "principiante al piano" o "fusión de reguetón con música electrónica con un sonido espacial de otro mundo", y el sistema compone una melodía acorde con tu petición. Funciona tanto si escribes solo un par de palabras como con un texto de varias líneas. MusicLM es incluso capaz de convertir en canción tus silbidos o de ponerle una melodía a un cuadro. Basta con teclear una descripción de La persistencia de la memoria, de Dalí o de El Grito, de Munch, para ponerlo a componer. Puedes escucharlo todo aquí, aunque no crear tus propias canciones... de momento.
Los resultados son sorprendentes por dos motivos. Primero, por la mezcla perfectamente acompasada de sonidos. "Cuando tienes muchos instrumentos que deben tocar a la vez y en armonía, la generación de música es mucho más compleja a nivel técnico. En estos archivos ocurren muchas cosas a la vez, y eso no es nada fácil de lograr", explica Choi. Luego está la calidad del audio, que se genera a una frecuencia de 24 KHz: a partir de los 20 KHz los aumentos son casi imperceptibles al oído humano. Es decir, suena igual que todo lo que oyes en Spotify, pese a que el servicio de streaming sirve su audio a 44,1 KHz.
Quienes han estudiado en profundidad el funcionamiento técnico de MusicLM, aseguran que la forma en la que Google lo ha resuelto es igual de brillante. Se trata de un cóctel de 2 millones de clips de 10 segundos con sonidos extraídos de YouTube, 5.500 parejas de texto y música obtenidas de otro servicio (MusicCaps), y los datos de modelos de IA previos, como AudioLM, SoundStream y MuLan. Es la primera vez que se prueba esta combinación de elementos técnicos y el resultado puede tener enormes implicaciones tanto para los artistas como para el mundo de la IA en general.
"A mí esto me recuerda más a Dall-E 2, la idea es similar. Escribes un texto y, en lugar de generar una imagen, obtienes una canción. Si lo comparas con ChatGPT, lo que ha hecho Google es muy superior porque es muy difícil detectar incoherencias o mala calidad. En ChatGPT enseguida te das cuenta de que hay errores gordos de razonamiento, alucinaciones etc. En imágenes también es fácil verlo, salen fotos de gente con manos de seis dedos y estas cosas. Pero con MusicLM, el nivel de perfección es mucho mayor", explica Andrés Torrubia, ingeniero y especialista en IA.
"Si lo comparas con ChatGPT, lo que ha hecho Google es muy superior, es muy difícil detectar incoherencias o mala calidad"
La música generada por inteligencia artificial no es nada nuevo. Hay herramientas muy populares que llevan funcionando desde hace años, como Amper Music, MuseNet (también de OpenAI) o Soundraw. Sin embargo, el nivel de calidad que consigue MusicLM no se había logrado jamás. De hecho, es tan inquietante que hasta sus creadores han preferido ser cautelosos y no abrir el sistema para evitar que todo el mundo juegue con él, igual que pasó con ChatGPT. La propia Google reconoce que su IA podría usarse para "apropiarse de contenido ajeno", es decir, plagio puro y duro. De fondo está además la gran pregunta: si ChatGPT está removiendo los cimientos de la educación, obligando a institutos y universidades a cambiar sus técnicas de enseñanza para evitar fraude, ¿qué va a ocurrir ahora con la creación musical? ¿Será el próximo hit mundial creado íntegramente por una IA? ¿Es una amenaza para los músicos profesionales?
"Sobre el plagio, es pronto para saberlo. Pero va a ser muy complicado detectar si una canción de un artista usa o no una IA y si esta a su vez usa fragmentos de otras canciones originales. Hablamos de variaciones muy sutiles, necesitas otra IA para detectarlas, y no van a ser perfectas", explica Choi. Lo que ya estamos viendo es un goteo de demandas a las compañías tecnológicas detrás de estas herramientas por considerar que están apropiándose indebidamente del trabajo ajeno a la hora de entrenar y crear sus sistemas.
El pasado noviembre, un grupo de programadores demandó a Microsoft y OpenAI por crear GitHub Copilot, una IA generativa que sugiere líneas de código para ayudar a los desarrolladores a crear software. Esta herramienta, igual que hace ChatGPT con los textos, Dall-E con las imágenes y ahora MusicLM con la música, está entrenada con contenido ya existente, en su caso, miles de millones de líneas de código. Los demandantes alegan que las sugerencias de Copilot contienen partes de código propietario sin pagar nada por ello.
"Yo no puedo tocar el piano, pero ahora, solo con silbar, ya puedo componer"
Algo parecido sucedió en enero, con una demanda contra Stability AI por usar imágenes sin permiso, demanda a la que luego se uniría la agencia de imágenes Getty Images. Hasta Elon Musk, uno de los cofundadores de OpenAI (abandonó la compañía en 2018) dejó caer que no descartaba tomar medidas legales tras enterarse que OpenAI tenía acceso a las bases de datos abiertas de Twitter para entrenar sus algoritmos. "OpenAI comenzó como un proyecto de código abierto y sin ánimo de lucro. Ya no es ninguna de las dos cosas", advirtió.
El pasado nos da una pista de lo que puede ocurrir a partir de ahora: todas estas demandas tienen en realidad muy pocas posibilidades de prosperar y detener la apisonadora tecnológica, para bien y para mal. "El boom de la IA va a generar una reacción entre los creadores del tipo "Me están robando mi contenido", explicaba Lawrence Lessig al medio especializado Vox. Lessig se pasó años luchando contra las discográficas que llevaron a Napster a la bancarrota en 2002. Las discográficas ganaron su pulso contra Napster, pero perdieron la que vino después contra la avalancha de piratería y el cambio del formato físico al digital. No les quedó más remedio que aliarse años después con Spotify y abrazar el streaming. Con la IA está ocurriendo algo parecido ahora mismo: un boom que muchos van a intentar detener en nombre del copyright... sin éxito.
La pelea abierta entre Microsoft, que acaba de invertir 10.000 millones en OpenAI, y Google, que planea reinventar su buscador este año con herramientas similares a ChatGPT, es otra prueba de que las 'big tech' están apostándolo todo por dominar la inteligencia artificial. MusicLM es el último ejemplo con el que Google saca pecho como aspirante a dominar este espacio. Está por ver si la Unión Europea impone reglas más estrictas a las tecnológicas que les impidan usar contenido existente para entrenar sus inteligencias artificiales. Pero, incluso si eso llega a ocurrir, los especialistas en IA aseguran que estamos al inicio de una nueva era que no tiene marcha atrás. Como Napster en 1999, pero 20 años después. "No sé qué va a ocurrir", dice Torrubia, "pero sí sé que no tengo ni idea de música. Yo no puedo tocar el piano, pero ahora, solo con silbar, ya puedo componer. Esto no lo frena nadie".
Por
04/02/2023 - 16:05
www.elconfidencial.com/tecnologia/2023-02-04/google-musiclm-chatgpt-musica-ia-inteligencia-artificial_3568719/