Índice
El mejor contenido en tu bandeja de entrada
La biometría de voz aterrizó en los titulares de la prensa durante el año pasado para sorprender a muchos y fascinar a otros tantos. Si bien el término reconocimiento de voz ya era conocido ampliamente gracias a los asistentes virtuales y otras aplicaciones derivadas del uso de los teléfonos inteligentes, la biometría presentaba una nueva forma de utilizar la voz para objetivos diferentes.
El fraude de identidad y la suplantación han compartido espacio en las mismas conversaciones y foros en los que lo ha hecho la biometría de voz, al igual que en aquellos dedicados a la experiencia de cliente y la productividad de los equipos de ventas. Compañías de sectores como la banca, los servicios financieros, las telecomunicaciones o los servicios públicos están ya haciendo uso de esta tecnología que ha demostrado ser fiable, segura y generadora de oportunidades.
Qué es la biometría de voz
La biometría de voz es una tecnología capaz de reconocer e identificar usuarios a través de la recopilación de datos sonoros obtenidos a través de la voz de una persona. Como factor de identificación biométrica, la voz representa un rasgo físico igual de diferencial que las huellas dactilares, el iris o el rostro.
Esta tecnología es capaz de crear un patrón biométrico sonoro derivado del habla de un usuario. La comparación de dos muestras sonoras y su diferenciación es la base de la identificación a través de este método. La voz es un factor de autenticación irremplazable, personal e intransferible.
También conocida como biometría vocal, la biometría de voz trabaja sobre las vibraciones y las ondas generadas por una persona al hablar y que son producto de un conjunto de órganos (boca, dientes, lengua, garganta, cuerdas vocales, faringe, cavidad buco-nasal…) únicos y específicos del individuo. El resultado del trabajo conjunto de cada engranaje del organismo es el tono vocal único de cada persona.
Funcionamiento y tecnología de la biometría de voz
Es común preguntarse acerca de la precisión y fiabilidad de esta técnica ya que todos hemos pasado por etapas donde nuestra voz se ha visto modificada ya sea por una enfermedad simple como un catarro o simplemente por el hecho de haber despertado hace pocos minutos. Del mismo modo, el paso del tiempo y el envejecimiento modifican nuestro tono vocal.
El buen saber hacer de los ingenieros más expertos y el uso de la tecnología más vanguardista y potente de las áreas de la inteligencia artificial y machine learning dan respuesta clara y confiable ante los retos que plantea identificar la voz de un usuario en momentos y circunstancias muy dispares.
El entrenamiento adecuado de la plataforma con suficientes muestras de voz en la fase de registro es crucial para obtener una huella vocal de calidad. De esta manera, las mejores tecnologías de biometría de voz analizan como mínimo 100 parámetros diferentes asociados a nuestra voz lo que resulta en una tasa de éxito absoluta.
Los métodos y la tecnología se compone de una forma muy similar a como lo hace el ya estandarizado y muy extendido reconocimiento facial, que hace lo propio generando un patrón matemático del rostro.
De cara al entrenamiento de los sistemas de biometría vocal, generalmente son tres las muestras de voz solicitadas al usuario por primera vez. En paralelo, se van analizando durante la fase de test y se comparan para su verificación entre ellas además de con otras muestras para generar el patrón de identificación diferenciada.
Tipos y modelos
Podemos encontrar dos tipos de biometría de voz de cara a la autenticación. Estrechamente relacionado con el momento en el que se ejecuta el sistema, el tipo escogido dependerá del caso de uso y de la aplicación en la que se va a producir la autenticación:
Biometría de voz activa
Este tipo de autenticación por voz solicita a los usuarios que digan en voz alta una frase o varias palabras un número determinado de veces para que el sistema pueda crear la huella de voz y asociarla a su identidad. Después, cuando el usuario quiera autenticarse, deberá recitar un número de teléfono, su número de cuenta u otra frase concreta para que lo dicho corresponda con la huella de voz.
Es decir, el usuario debe realizar una acción participando activamente concretando una frase que hace de contraseña. Este tipo de identificación biométrica por voz tiene una doble seguridad: el reconocimiento del patrón vocal y el conocimiento de una contraseña o dato.
Biometría de voz pasiva
La diferencia entre la biometría de voz activa y la biometría de voz pasiva radica en la participación del usuario al ser reconocida su voz. Aquí, no es necesario que el usuario diga unas palabras o frases concretas, sino que basta con que hable y diga cualquier cosa durante unos segundos.
El contenido de lo dicho no es relevante para considerar autenticarle. En este método se extreman los vectores y factores que interpretan la información sonora, lo que lo convierte en un método de identificación seguro e infalible al mismo tiempo que sencillo para el usuario. No importa el texto o ni siquiera el idioma en el que hable, con controles de seguridad que detectan voces pregrabadas.
Casos de uso y aplicaciones prácticas de la biometría de voz
Más allá de desbloquear un dispositivo, la biometría de voz ha encontrado su lugar entre las técnicas de identificación biométricas utilizadas para registrar, autenticar y verificar clientes y usuarios en múltiples casos de uso. Empresas y negocios de todos los sectores e industrias están integrando esta tecnología, aunque destacan las siguientes áreas de actividad:
- Banca.
- FinTech y servicios financieros.
- Utilities y servicios: gas, luz, agua…
- Sector telco.
- Educación y formación en línea.
Los sistemas de biometría vocal se integran en los procesos y operaciones de estas áreas a través de todo tipo de canales. Al igual que el reconocimiento facial, esta tecnología tiene lugar en los procesos de onboarding de cliente ya sea a través de una app o de una web. Por otro lado, aplicaciones más novedosas de ello están integrándola en chats y asistentes virtuales disponibles para los clientes en distintas plataformas.
Sin embargo, pese a que tienen lugar en todos estos canales, destaca el uso en videoconferencias y call centers (IRV y agentes comerciales o teleoperadores). En esta implementación, la recogida de la voz puede tener lugar antes o durante el contacto con el agente comercial, en función de cómo sea el caso de uso.
Verificación de Identidad
Como veníamos comentando, la verificación de identidad es el eje central de los procesos KYC (Know Your Customer) que ocurren durante el onboarding digital de los usuarios. Si bien el ya estandarizado reconocimiento facial es la norma y presenta una tasa de éxito absoluta, la biometría de voz se perfila para ser parte de los procesos KYC, ya sea como complemento o como factor único de identificación.
Autenticación de usuarios
Tras el registro durante el onboarding, el almacenamiento del patrón de voz es utilizado para autenticar al usuario cuando hace log-in en las plataformas de cliente para acceder a gestionar sus productos y servicios o gestionar sus preferencias. Es aquí donde la biometría de voz es fuerte, ya que aún muchos usuarios realizan sus consultas a través de vía telefónica.
Los agentes comerciales pueden disponer de información previa antes de atender al usuario ya que este interactuó con su voz en el asistente previo a la derivación a la atención personalizada. Por otro lado, otra forma de implementación consiste en reconocer al usuario los primeros segundos en los que se le pregunta sobre qué quiere realizar la consulta, tiempo suficiente para identificarle con la voz y desplegar su ficha.
La creación del patrón biométrico vocal puede crearse no sólo en el primer registro y onboarding si no que puede proponerse al usuario en cualquier contacto con él e informarle de que será utilizado para autenticarle en contactos futuros con más agilidad y facilidad para él y para los agentes que le atenderán.
Por otro lado, al igual que el rostro, la voz puede actuar como segundo factor de autenticación en estrategias MFA de Strong Customer Authentication (SCA) en cualquier plataforma. La combinación de rostro y voz evitaría SMSs que puedan incurrir en SIM Swapping o el olvido de credenciales.
Las transacciones y los pagos tanto vía telefónica como online están ya implementando la biometría de voz, por ejemplo para autorizar transferencias bancarias. Aplicaciones más disruptivas plantean también en el área turística y hotelera un check-in online con voz y hasta apertura de puertas en las habitaciones de hoteles, similar a lo que ya se hace con el rostro.
Firma y Aceptación
La firma electrónica avanzada es el método de contratación y aceptación de condiciones más ágil y versátil. La implementación de esta herramienta en los negocios de todas las industrias y áreas ha conllevado grandísimos beneficios y disparado tanto crecimiento como optimización de recursos.
La biometría de voz puede utilizarse en la firma digital para identificar a sus usuarios mediante la huella vocal. Respaldada por el marco común eIDAS (electronic IDentification, Authentication and trust Services), y avalada por los auditores más exigentes, cuenta con plena validez jurídica y es perfecta para casos de contratación del sector telco o energía a través de call center.
Ventajas: Experiencia de usuario
La biometría de voz es una nueva propuesta de cara a la mejora de la experiencia del usuario en la interacción con las marcas, plataformas y negocios. La obligatoriedad de identificar a los usuarios para cumplir con los requisitos regulatorios KYC, AML u otros asociados a normas sectoriales ha impulsado a las tecnológicas a desarrollar diferentes métodos de autenticación que impacten lo menos posible y eviten cualquier tipo de fricción.
Ha demostrado tener la misma precisión que otras técnicas de identificación biométrica y ser igualmente escalable y asequible. Su facilidad de integración y la disponibilidad de micrófonos en la mayoría de dispositivos la han hecho una opción muy viable en la actualidad.
La biometría de voz ha sido la respuesta a la agilidad en el contacto vía telefónica. El TMO (Tiempo Medio Operativo) ha mejorado considerablemente gracias a la implementación de la biometría vocal. También ha supuesto un alivio para las condiciones de baja luminosidad donde el reconocimiento facial obligaba a los usuarios a encender la luz, aunque esta sigue siendo la preferida en circunstancias donde hay muchísimo ruido. La complementación de ambas según el entorno es la solución más efectiva.
Reconocimiento de voz: diferencias y uso conjunto
Muchos se han preguntado la diferencia entre dos conceptos a priori muy similares, el reconocimiento de voz y la biometría de voz. Si bien comparten determinadas tecnologías, su objetivo es muy distinto.
Mientras la biometría vocal trata de identificar a un usuario para distinguirlo de otro, el reconocimiento de voz es una herramienta destinada a la comunicación entre personas y dispositivos digitales. También conocido como reconocimiento automático del habla (RAH), realiza operaciones relacionadas con la fonética, la sintaxis y la semántica para comprender lo que, a través de su voz, un humano quiere expresar con un mensaje acústico y sonoro.
Esta herramienta computacional es utilizada para transcribir y reconocer un mensaje, a diferencia de un tono. Como hemos podido observar, en la biometría de voz activa se hace uso del reconocimiento de voz para comprender credenciales (contraseñas, frases, números…) emitidas por un medio acústico.
Las dos tecnologías pueden trabajar en conjunto y funcionar para ambos propósitos o diferentes añadiendo ciertas funcionalidades adicionales. Los usos y aplicaciones del reconocimiento de voz per sé van desde el dictado automático hasta la interpretación de mensajes.