sábado, 29 de diciembre de 2018

Por qué tu voz es el nuevo petróleo para Silicon Valley


LUIS PAREJO

Los gigantes digitales ya dedican el 10% de I+D a los asistentes de voz. Para muchos expertos, será la mayor revolución desde la llegada del `smartphone? pero otros dudan: ¿es prudente instalar un aparato de escucha en la intimidad de nuestro hogar?


-Buenos días, Scarlett. Abre las persianas, léeme las principales noticias de EL MUNDO y prepárame un café con leche y un tazón de Choco Crispies, por favor.

-Ok, todo en marcha. Sólo una duda: ¿No crees que ya eres mayorcito para seguir tomando cereales azucarados?

Éste es el tipo de diálogo que probablemente tengamos todos los que sigamos aquí presentes dentro de 10 o 20 años. Una conversación con nuestro asistente de voz, que probablemente tenga la voz de Scarlett Johansson. Tal es el daño que hizo a nuestro imaginario colectivo Her (2013), la película de Spike Jonze en la que Joaquin Phoenixse enamoraba de su sistema operativo.

Empresas como Amazon, Google, Apple o Microsoft llevan años invirtiendo grandes sumas de dinero en la tecnología de reconocimiento de voz. Aventuran que el siguiente paso de la tecnología de consumo es hablar en nuestras casas con las máquinas a través de nuestra voz. Y están convencidas de ello. De hecho, están destinando alrededor de un 10% de su presupuesto de I+D a desarrollar este campo, según cálculos de la firma de inversión Loup Ventures. Y eso, sobra decirlo, es mucho dinero.


Numerosos analistas vaticinan que el reconocimiento de voz puede suponer el mayor cambio en la historia de la tecnología desde el lanzamiento del iPhone. Un escenario en el que las compras se realizan a través de una conversación con tu altavoz inteligente podría cambiarlo todo. Pero, ¿acaso no será una moda pasajera?

«Necesitamos interactuar con las máquinas de una forma lo más humana posible», sostiene Andrés Leonardo Martínez, responsable de relaciones de Google Cloud Ecosystem. «Varias compañías estamos apostando por la inteligencia artificial y una parte muy básica es el reconocimiento de voz. Estas tecnologías de interacción permiten que nuestras manos se liberen. Estás cocinando en casa y no te acuerdas de la receta... no tiene sentido que busques el móvil. Estás en el salón jugando con los hijos y te ponen en un aprieto con una pregunta... puedes salir de dudas sin levantarte. O quieres poner la radio, encender las luces... Antes forzábamos al usuario a que se adaptara al dispositivo. Y ahora es al revés, nos adaptamos nosotros a él».



NECESITAMOS INTERACTUAR CON LAS MÁQUINAS DE UNA FORMA LO MÁS HUMANA POSIBLE.

Andrés Leonardo Martínez, responsable de Google Cloud Ecosystem


Liberar las manos. Un acto que supone una revolución para el ser humano, habituado a interactuar con los objetos a través de sus articulaciones. A navegar por internet a través de un ratón, de un teclado, de una pantalla. Hasta ahora. Porque aunque en Europa el campo de la voz está todavía relegado al público que está siempre a la última en tecnología, al otro lado del Atlántico el escenario es bien diferente.

El mercado de EEUU acaparó en el tercer trimestre de 2018 el 42,1% de las ventas de altavoces inteligentes de todo el mundo, según datos de la web Voicebot. China el 29,4% del mercado y el Reino Unido el 5,4%. De hecho, entre un 20 y 30% de la población estadounidense ya tiene un asistente virtual en su casa, según datos de Adobe Analytics y Voicebot. Y las proyecciones para 2022 ya amplían este espectro al 55% de los domicilios en Estados Unidos.

Todo esto no es nuevo, pensarán algunos. Apple lleva nada menos que siete años intentando que hablemos con Siri, su asistente de voz; Amazon lanzó en 2014 su primera versión de Echo, lo que entonces denominaron como «altavoz conectado». Y lo mismo Google con Assistant o Microsoft con Cortana.

El anterior párrafo forma parte de los orígenes de la era de la voz. Ahora nos estamos adentrando en la siguiente etapa, todavía primitiva, con dispositivos más inteligentes que aspiran a convertirse en el sistema operativo de tu casa. Algo así como un mayordomo digital, aunque sin pajarita.

Muy bien, ¿y cómo funcionan? Por comandos de voz. Tan sencillo como decir «Hola Google», o «Hola Amazon», y el aparato se activa, presto a escucharte y a seguir tus órdenes. El gran cambio es que estos dispositivos están siempre ahí: ya no tienes que buscar tu móvil entre los pliegues de tu sofá.

¿Y para qué se utilizan? El abanico de opciones es aún limitado. «Estamos hablando de los primeros dispositivos y aún no son todo lo útiles que van a llegar a ser», comenta Xabier Uribe-Etxebarria, fundador de Sherpa, empresa vasca que produce un asistente virtual que integra la inteligencia conversacional y la predictiva.
Aún hay camino por recorrer

Ahora mismo, entre el 70 y 80% de las consultas están relacionadas con poner música, consultar el tiempo, activar la alarma, encender la radio o el temporizador para cocinar. Para realizar acciones más complejas, como encender las luces de tu casa o calcular cuánta leche queda en tu nevera, hay que tener los electrodomésticos conectados a tu asistente. Y el común de los mortales no ha llegado a esa etapa. Aún.

«En Estados Unidos todo está siendo mucho más rápido de lo que se podía pensar, de aquí a tres o cuatro años lo veremos bastante normal», dice Uribe-Etxebarria. «Las grandes empresas han entrado de lleno y está ayudando a que el mercado avance. Nosotros estamos trabajando en una versión avanzada que es predictiva, para que no tengas casi que preguntar. Se sabe tu agenda, te mira el tráfico, te puede seleccionar las noticias que más te van a interesar... Te puede decir incluso la ropa que tienes que llevar hoy».

¡Vaya! No vayas tan rápido, estarás pensando. Seguramente estarás leyendo este artículo a través de tu móvil, del ordenador de tu trabajo o del tradicional papel. Y todo lo que te estamos contando te suena muy lejano. ¿Cómo hemos llegado a esto? Sencillo: a través de la inteligencia artificial.

La tecnología actual funciona así: los altavoces inteligentes reconstruyen una señal a partir de los micrófonos que llevan incorporados. Luego hay una capa superior que es el reconocimiento de voz: transformar esa señal en una palabra. Y luego ya viene el procesamiento de lo que se denomina el lenguaje natural. Es decir, identificar diferentes secuencias de palabras y darles un significado. Así, cuando consultas el tiempo, sabe que te refieres a la temperatura.

«Se han creado unas expectativas muy grandes, estamos aún en una fase muy incipiente», advierte Diego Miranda-Saavedra, científico de datos y profesor de la Universitat Oberta de Cataluya (UOC). «No es un problema de reconocer tu voz, sino de procesar el lenguaje natural. De cómo utilizar la inteligencia artificial para que el lenguaje se traduzca en acciones. Si hago una pregunta estándar a 10 personas, cada una va a responder de forma diferente. Hay gente que habla mal, gente que no sabe bien un idioma... Son sistemas que se adaptan a cada persona, cada una pedimos diferentes cosas».

Una vez procesado el lenguaje natural, entra en juego el sistema de recomendaciones. Los algoritmos de estas máquinas juntan la información de los usuarios; en lo que se conoce como información colectiva. Esto quiere decir que nuestros datos van a ser compartidos con los de otras personas, y analizados con big data para aprender desde el ámbito global para terminar en el individuo. El dispositivo parte de lo que la gente hace de forma colectiva y, según tu historial, elige una de las opciones disponibles.

Por ejemplo, si dices «Hola Alexa, ¿qué restaurantes hay abiertos en mi zona?», el dispositivo te puede preguntar si te refieres a un radio de un kilómetro, porque otras personas lo han preguntado así. «Es refinar el juego entre lo que se está preguntando (lenguaje natural) y luego dar con la respuesta adecuada (sistema de recomendaciones)», explica Diego Miranda. «Por eso cuanta más información, cuanto más uso, mejor. Y así terminas por convertirte en una cobaya».

¿Una cobaya? Quizá hayas sentido un ligero escalofrío al leer esa palabra. Introducir en nuestras casas estos sistemas de inteligencia artificial suscita una serie de preguntas. Máxime después de los escándalos que han sacudido al sector tecnológico en los últimos meses, incluyendo las recientes revelaciones sobre la venta de datos a empresas por parte de Facebook.

Si coloco voluntariamente un aparato de escucha en mi casa, ¿estoy vendiendo definitivamente lo que me quedaba de privacidad? ¿Son seguros estos dispositivos? ¿No me grabarán sin que me entere? ¿Y si los hackean y luego difunden mis conversaciones privadas?

«No se trata de una cuestión de confianza, es una cuestión de empoderar al usuario dándole información completa y sencilla», apunta Andrés Leonardo Martínez, de Google. «Estos sistemas sólo se activan cuando los ejecutas (en este caso diciendo 'Hola, Google'). Cualquier otra cosa que hables no la procesa».

«Poco a poco internet está incorporando mayores mecanismos de control», señala Xabier Uribe-Etxebarria, de Sherpa. «La Comisión Europea está reforzando mucho su regulación en materia de protección de datos, y ésa es la línea que hay que seguir».

El dilema está sobre la mesa. Frenar los avances que nos aporta la tecnología es ir contra natura. Son mayores los beneficios que las contraindicaciones. Pero resulta ingenuo confiar ciegamente en unas compañías cuyo fin último es generar el mayor beneficio a sus accionistas. Los asistentes de voz suponen un paso de gigante en la evolución de la inteligencia artificial. Aunque de momento sólo los utilicemos para activar la radio y consultar chistes.


Madrid
28 DIC. 2018 01:52
https://www.elmundo.es/papel/historias/2018/12/28/5c251a37fc6c83814d8b4684.html

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.