Producción científica de alta calidad

Artículos

Reconocimiento de voz continuo e identificación del sistema de altavoces

febrero 20, 2026

Encuentra más información en nuestro repositorio digital

Actualmente el reconocimiento de voz y la identificación del hablante basada en un parámetro biométrico como la voz se han tratado como dos mundos diferentes y en el mercado no hay aplicaciones integradas de estos sistemas.

El diseño de un sistema podría significar una gran contribución al desarrollo de comandos personalizados, en el área de la automatización del hogar y la robótica, gracias a la disponibilidad del mensaje y la identificación del hablante.

Por lo tanto, se propone el desarrollo de un sistema biométrico de voz integrado, basado en una sola muestra de voz para la identificación del hablante y el mensaje. Utilizamos GOOGLE SPEECH API, como una herramienta de traducción de texto de voz, y los coeficientes cepstrales de frecuencia de Mel o MFCCs extraídos de la señal de voz para identificar la voz del hablante.

Se llevaron a cabo pruebas funcionales con 50 usuarios aleatoriamente, al final del estudio los resultados muestran una eficiencia de identificación del 96,4%, demostrando la eficiencia mediante el uso de MFCCs en el reconocimiento automático del locutor y verificando el uso de GOOGLE SPEECH API como una herramienta de traducción rápida, precisa y robusta.

Accede al artículo completo aquí