Los sentidos de la Inteligencia Artificial (IA) tienen firma española, en concreto de Verbio, una empresa que aporta "el sentido del oído y del habla" a los nuevos empleados digitales que emplean las empresas para que sean capaces de escuchar y responder a los clientes.

Así lo expresa el director general de Verbio, Jordi Torres, que en una entrevista con Efe explica cómo su empresa ha conseguido que Amelia, el software de Inteligencia Artificial de la compañía IPsoft que Telefónica utiliza en sus centros de llamadas de Perú, comprenda y sea útil para sus clientes.

"Para que Amelia pueda entender lo que el usuario está diciendo, lo que necesitamos es pasar la voz a texto. El ordenador no entiende la voz, entiende ceros y unos. Y al revés: para que Amelia pueda responder al usuario necesitamos transformar esos ceros y unos en voz sintetizada", aclara el español en un encuentro en Nueva York sobre Inteligencia Artificial.

Verbio ha sido la encargada de que los centros de llamadas de Telefónica en Perú, que recientemente han integrado un sistema de atención al cliente con "empleados digitales" programados con Inteligencia Artificial, hablen con acento peruano y con un tono agradable para sus usuarios.

Para explicar cómo lo hizo, Torres dio una charla en Nueva York en el marco del III Encuentro de Empleados Digitales, organizado por la empresa IPsoft, y donde Telefónica también presentó su iniciativa para mejorar la experiencia del usuario a través de la IA.

"Con Telefónica en Perú nos pasó una cosa sorprendente: tuvimos que dar marcha atrás para que el saludo de Amelia al usuario incluyera 'tu asistente virtual', porque llegaba un punto en que los usuarios no eran conscientes de que hablaban con una máquina", explica Torres, que lleva en Verbio desde su fundación en 1999, auspiciada por la Universidad Politécnica de Cataluña.

"El cliente empezaba a hablarle sin fin, pensando que quien estaba detrás era un humano, cuando necesitábamos que la interacción fuera más concisa y corta. Esto es algo bueno, porque la interacción resulta en que al final al usuario le resulta difícil darse cuenta de que es una máquina", asevera.

El 85 % de los empleados de la empresa -que cuenta con sedes en Estados Unidos, México y Brasil- son técnicos, aunque Torres desgrana que esto no incluye solo ingenieros, sino también al perfil más demandado y difícil de encontrar por su compañía: los lingüistas.

"No solo necesitas a gente que aporte la parte tecnológica, sino también la parte lingüística. Cuando necesitas que la máquina entienda al usuario, para que lo haga tiene que haber un proceso de comprensión semántica, contextual, de los diferentes tipos de acentos...", detalla Torres.

Este perfil de lingüista computacional es el difícil de encontrar, "no solo en España, sino también en Estados Unidos", y a veces provienen de la Universidad y, otras, de hacer tareas similares en otras compañías.

Estos expertos en lengua y gramática resultan primordiales para otra parte fundamental: construir la voz que habla a los usuarios. Estos se encargan de crear un corpus de palabras, con diferentes entonaciones, para después grabarlas y con un sistema informático "dividirlos e miles de trocitos para luego pegarlos y generar una voz".

Entre los ingenieros y lingüistas, el equipo también cuenta con un 20 % de doctorados, que se dedican al desarrollo del "state-of-the-art" en la tecnología: "Ese perfil te permite que no solo te centres en el día a día de la compañía, lo que hoy te sirve para hacer negocio, sino que se dedican a buscar productos nuevos".

Porque la mayor dificultad de la compañía está, no solo en encontrar los lingüistas, sino en trazar el nuevo camino a seguir, ya que es algo que no existe hoy: "La mayor complejidad está en tratar de estar evolucionando constantemente. Es definir hacia dónde queremos ir, qué queremos conseguir, no saber si esa nueva tecnología va a funcionar a nivel de usuario", subraya.