domingo, 4 de agosto de 2024

El buscador de OpenAI parece un cataclismo para Google, pero el riesgo está en otro lado



Sundar Pichai, CEO de Google. (EFE/Google)



SearchGPT ha empezado a probarse entre unos pocos usuarios, pero existe un extraño consenso de que ya es la mayor amenaza para la tecnológica. La cosa es mucho más complicada




Unas horas antes de que Google celebrase en mayo su cumbre anual de software, OpenAI contraprogramó este evento con una sorpresa. Las especulaciones se dispararon hasta tal punto que el propio Sam Altman tuvo que salir al paso y decir que lo que se iba a ver no era un buscador. Finalmente, presentaron GPT-4, un modelo que era capaz de trabajar sobre texto, pero también sobre imagen y audio; así como un modo de voz que desató una enorme polémica por su supuesto parecido con la de Scarlett Johansson.

Aquel lío se alargó durante semanas (la compañía suspendió esa funcionalidad y la activó hace unos días sin la polémica entonación) y la idea de un buscador cayó un poco en el olvido. Pero en este mundillo, cuando el río suena, agua lleva. La pasada semana, la firma presentó SearchGPT.

Se trata de un prototipo que está poniendo a prueba entre un grupo reducido de usuarios y que no se sabe a ciencia cierta cuándo llegará al mercado ni si lo hará en la actual forma con la que se ha puesto en marcha. Pero esto ha sido suficiente como para que muchos crean que esta herramienta es la mayor amenaza para el reinado de 25 años de Google y ya se atrevan a decir que es el principio de un cataclismo para el buscador más popular de internet.


SearchGPT, el último experimento de Altman

De cara al público, la beta de SearchGPT no tiene mucho misterio, una caja en la que el usuario escribe lo que quiere. La diferencia con Google es que no hay que buscar bajo conceptos y palabras clave, sino que se puede utilizar el lenguaje natural en las consultas. En lugar de devolver un listado de enlaces, lo que tendremos es una respuesta elaborada por ChatGPT donde incluirá las fuentes de donde proviene la información y "diversas formas de interactuar con ellas". Un guiño dirigido a los dueños de millones de webs que llevan meses especulando sobre cómo la IA generativa afectaría al tráfico de sus sitios después de años funcionando y operando bajo el modelo Google.

La firma dirigida por Sam Altman es consciente de esta inquietud y por ello se ha dedicado a tejer alianzas con todo tipo de editores y medios de todo el mundo, como el WSJ, Reuters o The Atlantic, entre muchos otros. El objetivo es doble: poder acceder a los contenidos y ofrecerlos a los usuarios, pero también poder tener más material para seguir entrenando sus modelos, sin ningún posible conflicto de propiedad intelectual como el que mantiene con el New York Times.

"Particularmente, no me parece un lanzamiento tan exagerado. Es un paso natural por parte de OpenAI. Si lo piensas, es lo que primero hizo Microsoft con Bing cuando se asoció con ellos. Incluso sobre el papel, tampoco es tan diferente de lo que tiene Google entre manos", explica José Luis Calvo, fundador de DivergerAI y experto en inteligencia artificial.

placeholderAsí funciona SearchGPT, el buscador web de OpenAI (X/@OpenAI)
Así funciona SearchGPT, el buscador web de OpenAI (X/@OpenAI)

Cuando se habla de lo que "Google tiene entre manos" se refiere a Overviews AI, una función de búsqueda basada en inteligencia artificial generativa presentada como experimento en 2023 y que se liberó para los usuarios estadounidenses hace unas pocas semanas. La herramienta, un módulo que se muestra en lo más alto de la lista de resultados y anuncios, acabó dando más que hablar por mostrar respuestas disparatadas como que echar pegamento a la pizza no era una mala idea, en base a una publicación de Reddit. Una crisis que hizo que los de Mountain View tuviesen que salir a la palestra, pedir perdón y asegurar que tomarían medidas para que no se volviese a repetir.

"Este es un riesgo que siempre va a estar presente. En el caso de Google o de OpenAI. Se pueden tener filtros para minimizar los casos, pero la posibilidad está ahí cuando se utilizan estas plataformas para buscar en internet", asegura Calvo.


Muchas más búsquedas

Este experto aclara que hay que diferenciar entre el conocimiento del modelo y lo que todavía no ha asimilado. "Si le preguntas algo sobre física teórica o filosofía puede contestarlo porque tiene ese conocimiento, porque el modelo ha sido entrenado con esa información, por así decirlo", detalla. "Sin embargo, cuando se busca el resultado de un partido o de un evento determinado que ha ocurrido hace poco, el sistema tiene que ir a buscar esos datos que no conoce y no tiene, procesarlos y construir la respuesta. Siempre está el riesgo de las alucinaciones, pero es que aquí se añade la posibilidad de traer algo que no sea correcto. Entonces, el sistema, que no comprende lo que dice, tiene una posibilidad de elaborar algo equivocado".

También cabe mencionar que esta orientación de ChatGPT solo ataca una de las tres grandes clases de búsqueda, las llamadas "búsquedas informacionales", que son las que tienen que ver con la documentación, el descubrimiento y el conocimiento. "En este sentido, la IA generativa sí aporta algo porque es más cómodo, rápido y sencillo que andar buscando, leyendo texto y ver si es lo que queremos o no", apunta Calvo.

Esto, realmente, no es tan diferente a lo que ya habíamos visto hasta ahora con ChatGPT. Incluso Google, salvando las distancias, ya había introducido en el pasado cambios que apuntaban en esta dirección con esos resúmenes y bloques de preguntas que pretendían darnos de un vistazo la información que estábamos buscando. Esa idea de adelantarse a la búsqueda que quieres y ahorrarte trabajo es también un poco la idea detrás de Discover, que te descubre contenidos en base a tu historial.

"Este debate lo estamos teniendo porque creo que la búsqueda de Google está bastante rota desde hace un tiempo por el tema del abuso de anuncios y resultados patrocinados", explica Paloma Llaneza, autora de Datanomics y abogada especializada en tecnología y ciberseguridad. Ella misma confiesa que es usuaria de pago de dos plataformas de IA generativa, Perplexity y OpenAI, porque le "ahorra muchísimo tiempo de búsqueda y documentación". Esta experta rechaza esa idea de que este desafío sea como otros en los que Google ha salido victorioso (Yahoo, Bing, DuckDuckGo…). "Esto es un terreno de juego completamente nuevo. Es algo completamente diferente", apunta.


placeholderSam Altman. (Reuters)
Sam Altman. (Reuters)

Pero hay otros dos tipos de búsquedas que todavía no están en esta ecuación, que son las búsquedas que tienen que ver con una compra, una reserva o similar, conocidas como transaccionales; y las que tienen que ver con el querer ir a una web determinada.

"El sistema que Google ha levantado es muy redondo y por eso nadie ha podido moverlo en tantos años", analiza Calvo. La firma dirigida por Pichai tiene que enfrentar un asunto espinoso, que es el de los resultados patrocinados y el tráfico que lleva a los creadores de contenido, algo que también le reporta ingresos por los anuncios que se muestran en sus webs. "Era un círculo virtuoso muy logrado. Por eso no es fácil ejecutar los cambios".


¿Quién paga esta fiesta?

Esa es una de las dudas que hay en torno a SearchGPT. Hace unos días, trascendió la información de que OpenAI se había convertido en una máquina de quemar dinero y que necesitaban unos 5.000 millones este curso para seguir con los desarrollos en marcha. A día de hoy no son rentables y lo que ingresan no les da para cubrir gastos. Esto plantea muchos interrogantes, más aún teniendo en cuenta que la búsqueda basada en IA generativa es mucho más cara que la búsqueda web tradicional.

¿Cómo rentabilizarlo? Alcanzar un número de suscriptores lo suficientemente grande parece complicado, más aún cuando la propia Google está desplegando herramientas gratuitas con Gemini. La publicidad, además de no saber cómo utilizarla en este nuevo escenario, requiere un gran volumen para salir a cuenta y montar un equipo y una estructura que ahora mismo OpenAI no tiene. Llaneza afirma que existen grandes posibilidades de que se fragmente el mercado de la navegación en internet, con personas que opten por herramientas de pago y otros que opten por lo que hay en abierto y seguir en Google. "No digo que se vaya a hundir, pero creo que van a ver muy mermadas sus estadísticas. Eso sí, son cambios que requieren tiempo".

"Ahora mismo, esa fiesta la pagan los inversores", sentencia Calvo, que cree que este invento de OpenAI no le va a quitar tanta cuota de mercado a Google, al menos, en el medio plazo. "Es muy difícil. Mira los años que lleva Microsoft con Bing quemando dinero y no ha arañado casi nada. Es algo muy lento y muy difícil", defiende. Y apunta: "Está el factor costumbre, el hábito. Hay gente que va a Google hasta para meter una página que ya se sabe".


placeholderFoto: Reuters/Dado Ruvic.
Foto: Reuters/Dado Ruvic.

La pregunta es si algo puede romper el hábito. Y hay quienes señalan ya de dónde viene el peligro. Un informe de Bank of America afirmaba que SearchGPT por sí mismo no era un gran peligro para Google. Y daba un dato esclarecedor: el buscador tuvo un tráfico diario de 2.700 millones de visitas diarias. 28 veces más que el chatbot de Sam Altman.

Pero ese estudio afirmaba que el matrimonio entre OpenAI y Apple sí que podía traer más dolores de cabeza. No hay que olvidar que los de Mountain View pagan una millonada a los de la manzana cada año por ser el buscador predeterminado. Si ese acuerdo se rompe u obligan a romperlo por motivos de competencia, los de Cupertino podrían optar por estrechar sus lazos y hacer una mayor integración, poniendo el buscador de OpenAI a un par clics de distancia de millones de usuarios del iPhone o del iPad.

"Seguimos pensando que será difícil para cualquiera acercarse a igualar las capacidades de búsqueda y los incentivos financieros de Google", resolvía el informe de Bank of America. El problema de Mountain View no parece tanto el de que tenga que gestionar un gran rival, como que reciba bocados en pequeños frentes.


Otros frentes

Uno de estos frentes es el que afecta a YouTube, uno de sus productos estrella. La aparición de TikTok supuso un seísmo en un sector que había dominado con puño de hierro durante mucho tiempo. Además, también tuvo efecto en las búsquedas de los más jóvenes, que en un buen porcentaje optaban por la aplicación china como primera fuente de información.

La compañía puso entonces en marcha, al igual que Instagram con Reels, un formato de videos cortos conocido como Shorts. Hay cierta sensibilidad con este asunto y prueba de ello es cómo las acciones de Alphabet, matriz de Google, se desplomaron hace una semana, a pesar de tener superávit. Uno de los motivos principales de esta pájara bursátil fue que YouTube, precisamente, no había cumplido las expectativas de ingresos en los últimos meses.


placeholderFoto: Reuters.
Foto: Reuters.

La plataforma de video es un activo fundamental para los intereses de la gran G. A día de hoy, es uno de los principales puntos donde acuden los usuarios a escuchar música o consumir televisión de forma no lineal. Pero también han conseguido una economía que sigue siendo un imán para cientos de miles de creadores, que generan millones de horas de video. Millones de horas de video que también atraen audiencias y búsquedas de descubrimiento y conocimiento. Millones de horas de video que también son gasolina para entrenar y mejorar sus modelos de IA. Desde Apple hasta OpenAI han recurrido a esta fuente. Ahora que algunas investigaciones ya han dejado al descubierto estas prácticas, habrá que ver si Google corta el grifo a sus rivales.

Pero hay otro campo de juego en el que se está empezando a ensayar mucho con la IA generativa y que no ha levantado tanto interés. Empresas como Amazon o Walmart están haciendo muchos esfuerzos para integrar la tecnología de moda en sus plataformas y eso puede acrecentar una dinámica y un cambio de paradigma que se está cocinando, a fuego muy lento en Estados Unidos: el de que cuando se va a hacer una compra en internet, la búsqueda no empiece por Google sino por sitios de compras. Una encuesta de Jungle Scout, una empresa de software especializado en e-commerce, ya apuntaba que seis de cada 10 usuarios solían empezar este tipo de búsquedas directamente en Amazon. La encuesta, que permitía escoger múltiples opciones, colocaba los motores de búsqueda como Google en segunda posición (49%) y Walmart.com en tercer lugar (32%). La inteligencia artificial no puede más que acelerar este cambio de papeles. Y eso puede tener efecto en los ingresos por publicidad del buscador.

Ante todas estas amenazas, Google no se ha quedado parado. Está desplegando todo tipo de funciones de inteligencia artificial en sus productos, algunas de ellas de pago y otras de uso gratuito. No hay que olvidar que hay una gran masa de público reacia al pago. Para incentivar la suscripción, el buscador combina el acceso a Gemini Advanced con 2TB de almacenamiento en la nube, algo que OpenAI no puede ofrecer ahora mismo.

Ante el peligro de que Apple estreche su relación con OpenAI, la compañía ha fortalecido sus lazos con Samsung, el mayor fabricante del mundo, como quedó demostrado en su último Unpacked. También hay que tener en cuenta el factor Android y la enorme cuota de mercado que tiene a nivel global. En lo que se refiere a los acuerdos, los de Mountain View también han movido ficha y han firmado con Reddit, el mayor foro de internet, un acuerdo que ha servido para que ellos puedan acceder a su contenido, tanto para indexarlo en el buscador como para entrenar su IA.

Pero también ha servido para que sus rivales no puedan. La compañía que gestiona esta comunidad ya ha advertido a Microsoft, que el bloqueo seguirá a excepción de que pasen por caja. ¿Este acuerdo puede acabar siendo escrutado por las autoridades antimonopolio? Llaneza cree que los riesgos están en otro lado. "Son muchas variables. Hay que ver cómo afecta eso a los competidores, qué efecto tiene que no puedan acceder a esos contenidos… También el efecto sobre los consumidores, ya que al ser un producto gratuito no está el factor del precio para detectar esos problemas monopolísticos. No es fácil abordar esto. En todo caso, veo más puntos sensibles en el aspecto de los datos personales y la relación del contenido con los usuarios", concluye Llaneza.