Por Felipe Schwartzmann
Territory Manager, South America de Interactive Intelligence
Todos hemos experimentado las dificultades del reconocimiento de voz cuando se llama a las empresas. Si bien algunas de estas malas experiencias tienen que ver con problemas en el diseño de los sistemas, muchas otras son consecuencia de limitaciones inherentes al reconocimiento automático de voz.
La comprensión de estas restricciones es fundamental para establecer expectativas realistas de rendimiento, así como para trabajar en la optimización de recursos, centrándose en factores que pueden ser modificados.
Las siguientes son dos limitaciones del sistema que comúnmente se pasan por alto.
La primera se refiere a los archivos gramaticales: el reconocimiento de una aplicación de voz se apoya en un archivo gramatical para cada colección. Si bien existe una serie de ajustes adicionales relacionados con los niveles de sincronización y de confianza, un archivo de gramática es el motor de voz que se compara con la expresión de la persona que llama para determinar un resultado. Por lo general, los problemas no surgen cuando el motor de reconocimiento de voz no reconoce lo que se dice, sino cuando la persona que llama dice algo que el archivo de gramática no contenía, o cuando no se puede igualar a una entrada en el archivo. El sistema está haciendo todo lo posible para confirmar lo que la persona está diciendo, pero ese contenido no está.
La segunda limitación se relaciona con lo que el sistema escucha efectivamente, algo que muchas veces difiere de lo que quiere escuchar. A diferencia de los humanos, estos sistemas siempre escuchan. Sin embargo, existen expresiones que no son reconocidas. Un ejemplo podría ser una risa, o un carraspeo. Muchos usuarios llevan a cabo múltiples conversaciones al interactuar con una aplicación de voz, y a menudo no se dan cuenta de que el sistema está escuchando a ambas conversaciones. Este tipo de comportamientos es muy difícil de descifrar.
La comprensión de las limitaciones de estas herramientas ayuda a las empresas se centren en las cosas que pueden cambiar para mejorar el rendimiento, evitando el desperdicio de recursos.
Si bien existen limitaciones inherentes, hay un número de factores que pueden maximizar el rendimiento de estas herramientas.
Las siguientes son dos buenas prácticas que pueden mejorar significativamente los resultados:
Recuerde que este tipo de aplicaciones requieren de ajustes periódicos. Las alineaciones iniciales permiten mejorar el rendimiento de manera sostenida. Lo recomendable es que, durante el primer año, se realicen de dos a tres ajustes. Para aplicaciones más maduras, uno o dos por año serán suficientes.
A medida que se entienden las limitaciones inherentes y se perfeccionan las prácticas, los sistemas de reconocimiento de voz ofrecen una experiencia mejorada para la persona que llama, minimizando los costos para la empresa que atiende.
Este acuerdo permite una escala rápida al tiempo que reduce el consumo de energía y…
Las líneas de diálogo entre gobierno, industria y academia se centraron en Inversión Tecnológica en…
Por Rafael Hirata, Jefe de Innovación y Desarrollo de Negocios Digitales, responsable de Servicios de…
Según Everest Group: “Appian tiene como objetivo ofrecer automatización y orquestación integral de procesos a…
Por Uriel Fraire, Regional Sales Manager Mexico de Universal Robots.
Por: Ivan Sánchez, VP Sales LATAM, Infoblox.