En 2019, Gartner predijo que solamente dos años después el 25% de trabajadores digitales utilizaría un asistente virtual a diario, y que, a su vez, en 2023 uno de cada cuatro contactos con estas herramientas serán por voz.
Estas afirmaciones se sustentaban en la democratización de la inteligencia artificial (IA), y en el desarrollo de tecnologías de voz como Alexa for Business de Amazon, que permite delegar tareas como la planificación de reuniones y operaciones logísticas, o MIKA, el asistente de Nokia que ayuda a los ingenieros a diagnosticar y solucionar problemas complejos.
Dos años después, el grado de implementación de la primera de las predicciones no coincide exactamente con la realidad, aunque sí se han experimentado avances en ciertos sectores profesionales y, especialmente, en el desarrollo de las aplicaciones por voz. AGVoice, por ejemplo, es una tecnología interactiva y de manos libres que ha permitido que la ganadería y agricultura mejoren la gestión de datos en un 50 %.
Otro ejemplo lo encontramos en el gran consumo. La empresa estadounidense Walmart ha incorporado la aplicación por voz Ask Sam, que comunica a los empleados sus turnos, el stock disponible en las tiendas y también almacena recibos. Así, no tienen que buscar esta información en el ordenador y ganan tiempo para realizar otras tareas.
Pero hay más datos a tener en cuenta sobre la progresión de los asistentes de voz en el entorno laboral: Adobe publicó un estudio hace un par de años que revela que el 91 % de las marcas consultadas está invirtiendo en esta tecnología. Y las expectativas de crecimiento en el mundo entre 2019 y 2024 revelan que se trata de un mercado multimillonario. ¿Ha llegado el momento de sumarse a esta tendencia al alza?
Los beneficios de la tecnología por voz
En 2020, ISDI publicó el estudio El uso de la tecnología de la voz en España, que refleja el impacto en la percepción del consumidor de esta tecnología, así como la calidad de la respuesta dada por los principales players ante la demanda.
El resultado muestra un alto grado de interés por esta innovación en nuestro país, por encima del 7 sobre 10. Más del 50 % de la población utiliza aplicaciones de voz para realizar acciones en sus dispositivos inteligentes, especialmente la búsqueda de información y llevar a cabo multitareas.
“La tecnología de consumo tiende a cambiar el comportamiento de las personas. Estas experiencias luego impulsan su demanda y uso en los entornos empresariales. Esto será extrapolable a la voz en las diferentes aplicaciones y dispositivos”, opina Esther Checa, responsable de innovación en t2ó y docente en ISDI.
Para el 62 %, el mayor beneficio es el ahorro de tiempo. Y si pensamos en el contexto laboral, esto suele traducirse en una reducción del coste global para las empresas. Otra ventaja es la automatización de tareas repetitivas, que permite centrarnos en trabajo más interesante o que requiere de una mayor atención.
Privacidad y seguridad, cuestiones por resolver
Básicamente, y tal y como sucede con cualquier tecnología del espectro digital, la seguridad y la privacidad son dos de los puntos calientes. El reconocimiento de voz se clasifica como una tecnología biométrica a la que se accede después de acreditarnos con una característica humana única, como en el caso de la huella dactilar o la identificación por retina.
“La biometría de voz es una de las propuestas que más se está impulsando para que se convierta en un autentificador e identificador digital y remoto, evitando introducir passwords de forma manual y ayudando a eliminar el fraude”, afirma Checa. Por ejemplo, esta tecnología se está incorporando en sectores como la banca para sus canales de atención al cliente.
Para las empresas que desean implementar aplicaciones de voz, ya sea para que sus empleados la utilicen con el objetivo de acceder al sistema o para fabricar un dispositivo inteligente dirigido al gran consumo, se deben tener en cuenta dos factores.
El primero, relacionado con la legalidad, es la adhesión a las normativas relativas a la protección de datos a nivel nacional o supranacional. El segundo, el diseño de robustos sistemas de ciberseguridad, ya que muchas de las tareas que realiza esta tecnología se basan en el análisis de información propia de la compañía, que deben protegerse con sumo cuidado.
“Inevitablemente estas compañías necesitan datos de voz para entender el tono, el género o la intención del hablante para mejorar sus productos y para entrenar sus modelos de IA. Sin ellos difícilmente serán eficientes, pero también deberán ser más transparentes sobre cómo los recogen, qué uso se les da o cómo hacer partícipes a los usuarios”, advierte.
Los sectores más buscados
La respuesta entre los diferentes verticales sujetos del estudio de ISDI muestran resultados que dependen principalmente de la tipología del contenido. Por un lado, el área de entretenimiento cuenta con un gran número de datos públicos y estructurados. Por el otro, en ‘Finanzas y banca’ las consultas más frecuentes son de tipo “glosario” o “búsqueda de términos”, un caso de uso que asistentes como Google Home Mini y Amazon Echo Dot resuelven con eficiencia.
Alexa destaca en ‘Entretenimiento-cine’ gracias a la base de datos de Internet Movie Database. En el caso de ‘Gran consumo-cocina’, ha mejorado la experiencia de usuario respecto a la versión nativa. Por su parte, Google aprovecha la mejor organización de sus contenidos en su knowledge graph, que en este estudio han sido ‘Entretenimiento-cine’ y el territorio de finanzas.
Un asistente de voz en la oficina
Trasladado al escenario laboral, el rol más inmediato de la tecnología de la voz es el de asistente digital: un dispositivo que gestiona la agenda, toma notas en una reunión, escribe correos electrónicos o pide mesa en un restaurante donde nos vamos a encontrar con un cliente, a quien también le notificará la reserva.
Esther Checa sostiene que la necesidad de usar esta tecnología viene marcada por las particularidades de cada industria. “Sin embargo, independientemente del sector, para que la experiencia de voz ideada por la marca resulte útil, destacaría tres aspectos básicos; un desarrollo consistente, en el cual la voz debe proporcionar una experiencia de marca coherente, y que permita el control de la identidad de marca y la experiencia de usuario”.
La experta enumera varios ejemplos de herramientas de voz:
- Oracle Digital Assistant Platform, que permite la colaboración entre equipos, automatización de tareas manuales o soporte multilingüe.
- Cortana, de Microsoft, cuenta con funciones como Play My Emails en Outlook, que lee los correos electrónicos de la bandeja de entrada, o Surface Headphones, que ejecuta acciones productivas, como enviar mails, crear recordatorios o unirse a una reunión de Skype o Teams.
- Google Assistant puede acceder a las aplicaciones de Workspace, abrirlas y buscar documentos. Además programa llamadas, genera mensajes de texto, recordatorios de hora, crea notas, y agenda y cancela reuniones.
- Otras herramientas disponibles son Biometric Vox, Voicekey, Nuance, Analyticalls, Walkie, Otter o Suki, cada una con una función concreta aplicada a sectores amplios o específicos.
El futuro inmediato de la tecnología de la voz
Como sucede con cualquier tecnología que emplea la IA, las habilidades de aprendizaje mejoran a base de repetición y afinando algoritmos que la alejen de la robotización para acabar mimetizando comportamientos más naturales del ser humano.
El estudio de ISDI avanza que los sectores que se beneficiarán a corto plazo del potencial que presenta esta herramienta son supermercados, restaurantes y medios de comunicación.
“El éxito de la voz dentro de las organizaciones va a venir marcado por el grado de adopción que quieran hacer los empleados. Si estos ven y entienden sus beneficios, entonces funcionará; de lo contrario, podría crear ineficiencias. Es recomendable que las empresas implementen sus funcionalidades de forma escalonada y evalúen si la inversión en su instauración les lleva a tener resultados valiosos”, recomienda Checa.
Como sucede con la tecnología disruptiva, existen dos tipos de empresas: los early adopters, que se lanzan a la piscina para testar estos desarrollos, y aquellas que van sobre seguro y prefieren esperar a que se demuestre su eficacia. Con la voz parece que no hay dudas de que llega para quedarse, aunque queda camino por recorrer.
Fotos: Unsplash/ Windows