Languages

Realidad Bagur

Title

La revolución está aquí y tiene voz

inteligencia artificial

Title

13 de noviembre de 2018

En un futuro no tan lejano podremos interactuar con la mayoría de la tecnología que utilizamos en estos momentos a través de nuestra voz. De acuerdo con una encuesta realizada por Pindrop a 500 empresas y líderes en tecnología en Estados Unidos, Francia, Alemania y Reino Unido, más de dos tercios de empresas planean utilizar voz e inteligencia artificial para la mayoría de sus interacciones con consumidores en los próximos 12 meses.

En un pasado no tan lejano, cada conversión dependía en gran medida de cómo hubiera ido la conversación con el vendedor. ¿Qué sabía el vendedor sobre el producto? ¿Ayudó al cliente a encontrar lo que buscaba? ¿Generaba confianza? ¿Escuchaba al cliente? ¿Sabía su nombre? ¿Se acordaba de qué cosas le gustaban, o no? La economía conversacional está emergiendo rápidamente, dejando que volvamos a un comercio más personal y personalizado donde los clientes son tratados como seres humanos.

Sin embargo, eso sólo se hará realidad si diseñamos correctamente las interfaces conversacionales, haciendo un buen análisis de las necesidades de los usuarios, sus expectaciones y el contexto en el que se produce dicha interacción de voz. Estamos ante una transformación tan importante como la introducción de las “Graphical User Interfaces” (GUIs) en los 90 y como diseñadores de experiencia de usuario nos surgen una serie de retos a la hora de abordar proyectos conversacionales:

¿Cómo diseñar una conversación más natural?

Diseñar una conversación natural y humana es uno de los retos más difíciles. Sabemos que las personas se comunican con interfaces conversacionales como lo harían con un ser humano, aun sabiendo que no lo son. Por ello, lograr que una interfaz conversacional sea lo más natural posible es especialmente importante, tanto si es una interfaz basada en texto (chatbots) o basada en voz (Asistentes de voz, Call Centers Cognitivos y Robots conversacionales).

Existen 4 aspectos fundamentales que pueden ayudar a humanizar y mejorar una conversación:

  • Cooperar. Este aspecto se basa en el Principio de Cooperación de Paul Grice que afirma que cuando nos comunicamos, asumimos que las personas con las que hablamos cooperarán para mover la conversación hacia un objetivo determinado. Esta cooperación se manifiesta en “Máximas conversacionales” que tienen que ver con la cantidad de información que ofreces (no contar demasiado ni demasiado poco), con la calidad (ser veraz), con el modo de expresarte (claro, breve y ordenado) y con el contenido (ser relevante).
  • Conversar. Una conversación no es sólo una pregunta y una respuesta. Así, el siguiente gran paso que debemos abordar y trabajar como diseñadores es el de generar diálogo.

Idealmente, deberíamos considerar casos de uso más complejos y diseñar conversaciones de manera que el usuario pueda hacer otra pregunta sobre la respuesta que la interfaz conversacional le haya dado. Por ejemplo, esta mañana le pregunté a Siri “¿Qué citas tengo para hoy?” y perfectamente me indicó la cita con mi médico a las 17.00 horas. Después le pregunté “¿Cómo llego hasta allí?” (la dirección estaba en los detalles de la cita) pero me contestó “¿Dónde quieres ir?”. Siri entendió la pregunta de forma individual, no como una pregunta proveniente del flujo anterior. No pudimos conversar.

  • Personalizar. Conocer al usuario con el que estás hablando, saludarle por su nombre y ofrecerle información relevante es imprescindible para que éste tenga una experiencia óptima con nuestra interfaz conversacional.  Igualmente, identificar casos de uso predictivos pueden mejorar significativamente la experiencia.
  • Desambiguar. En ocasiones los bots no entienden todo lo que está diciendo el usuario por lo que no puede proporcionar una respuesta 100% adecuada. En estos casos es importante clarificar la intención del usuario antes de seguir. Preguntas como “¿Quisiste decir…?” pueden ser de ayuda. Por otra parte, hay que tener en cuenta el contexto ya que existen situaciones en las que clarificar la intención del usuario puede crear un efecto no deseado. Por ejemplo, si yo vivo en Cartagena (España) y le pregunto al bot, “¿Qué tiempo va a hacer en Cartagena hoy?” debería ofrecerme información sobre la ciudad en la que vivo o la más cercana, en lugar de clarificar a qué Cartagena me refiero de las 30 ciudades que tienen el mismo nombre en el mundo.

¿Cómo diseñar la personalidad y la voz de un bot?

Varios estudios demuestran que las personas asociamos rasgos humanos como género, personalidad y emociones a cualquier tipo de sistema –coches, TV y sistemas computacionales.

Teniendo esto en cuenta, es necesario no dejar al azar la personalidad del bot ya que podría estar comunicando valores que no queremos transmitir. Para ello, al inicio de cualquier proyecto conversacional es imprescindible la definición de la persona o perfil del bot donde se definirán aspectos como: femenino/masculino, edad, motivaciones, frustraciones, qué valores se quieren transmitir, el lenguaje y tono. También se definirán las características principales de la voz como su madurez, intensidad y velocidad. En este punto es interesante hacer un pequeño test de voces con usuarios antes de seleccionar la voz adecuada para tu sistema conversacional.

¿Cómo, para qué y en qué contexto interactúa la gente con un bot?

Entender el comportamiento humano y sus reacciones es esencial para diseñar mejores interfaces conversacionales y mejores productos.

Es importante no olvidar los procesos de diseño centrados en el usuario al diseñar interfaces conversacionales. Por ello, antes de iniciar un proyecto conversacional deberíamos entender las necesidades del usuario y su contexto de uso. Eso nos ayudará a identificar los casos de uso en los que queremos trabajar – ¡no todos los casos de uso valen! – y priorizar los que tengan más valor para el usuario.

Y como en el diseño de todo producto, la clave está en testear e iterar hasta que estemos cómodos con la solución final.

¿Cómo hacer que un bot sea más creíble y guste más?

Las relaciones interpersonales han sido objeto de interés desde los años 30 del siglo pasado, aunque con el surgimiento de interfaces conversacionales se han planteado nuevas preguntas.

Estudios demuestran que los seres humanos sabemos determinar perfectamente si otras personas se nos asemejan y en qué términos (género, raza, clase social, personalidad e intereses). Además, tenemos especial preferencia por aquellas personas que son similares a nosotros. Este hecho aplica también a interfaces conversacionales, aunque la persona sepa que está hablando con una máquina.

Como consecuencia, las interfaces conversacionales que se parecen más al interlocutor serían más creíbles, gustarían más y generarían más confianza.

Este hecho conlleva varias inquietudes a la hora de diseñar interfaces conversacionales:

  • ¿Cómo diseñamos un sistema conversacional que pueda gestionar varias personas?
  • ¿Cómo hacemos para que el sistema reconozca las características claves y emociones del usuario? 
  • Y finalmente, ¿Cómo seleccionamos a la persona adecuada para la interacción con un usuario determinado?

¿Qué nos depara el futuro?

Según Forbes, los dispositivos voice first son el siguiente gran paso en tecnología conversacional. Se trata de dispositivos que utilizan voz como interacción principal, pero voz no es la única interfaz. Un ejemplo sería el Echo Show de Amazon que cuenta con una pantalla para ofrecer cierto tipo de información al usuario.

Este tipo de dispositivos ofrece experiencias más sofisticadas y mejoras en cuanto a la carga cognitiva necesaria para la interacción. Uno de los ejemplos más significativos es que no hace falta que el usuario recuerde las diferentes opciones para hacer una selección ya que simplemente puede verlas en la pantalla complementaria.

IBM habló con 30 científicos y líderes sobre el futuro de la tecnología conversacional y la mayoría coinciden que los avances en la interacción Persona-Máquina Human dependen en mayor medida de la inteligencia artificial. Así, en los próximos 3-5 años los avances en inteligencia artificial mejorarán significativamente las capacidades conversacionales para lograr conversaciones mucho más efectivas y sofisticadas. Además, se abre un mundo de posibilidades para integrar la inteligencia artificial, no sólo en la forma en la que lo hemos experimentado hasta el momento.

Definitivamente, estamos ante una fascinante revolución, que está aquí para quedarse y tiene voz.

 

 

Lee más sobre la tendencia "Voice-first" en nuestro paper "La nueva era de la Banca Conversacional".

Categorías

1 Comentarios

  • DN

    2018-11-22 at 03:08

    Diego Nava

    said:
    Excelente artículo. De igual forma aprovechar las invitaciones de los proveedores de este tipo de tecnológica e irnos adaptando a esto. Ya que como dicen en un futuro no muy lejano debamos innovar en este campo que tiene voz.

Deja tu comentario