Uso de Resta Espectral para Reconocimiento de Voz Bajo Condiciones de Ruido-Edición Única

Citation
Share
Date
Abstract
El contenido de este trabajo de investigación es mostrar una perspectiva del uso de reconocimiento de voz, incluyendo las aplicaciones en las que es útil esta tecnología, la explicación de los fundamentos teóricos que permiten la conversión de señal de voz a palabras o comandos entendibles por una máquina, incluyendo tambiÈn una explicación rápida del proceso fisiológico de producción de voz. Posteriormente se hace mención del efecto que un ambiente con ruido provoca en un sistema de reconocimiento de voz, degradando su precisión en menor o mayor grado dependiendo de la cantidad de ruido contaminante que se encuentre presente. Se hace uso de una técnica llamada resta espectral para el tratamiento de ruido en los sistemas de reconocimiento de voz. Se demuestra mediante pruebas realizadas y documentadas en este trabajo, que en base a la media y desviación estándar de un estimado de ruido, es posible calcular uno de los parámetros que vuelven más efectiva la resta espectral obteniendo un desempeño favorable cuando se trabaja en presencia de ruido contaminante. Los experimentos realizados fueron hechos con la herramienta de reconocimiento de voz Sphinx, que se basa en el uso de modelos ocultos de Markov, esta herramienta fue realizada en la universidad Carnegie Mellon y se ejecuta sobre plataformas Linux. Para realizar las pruebas se usan 2 cuerpos de voces grabadas, uno en idioma español con contenidos de dígitos, y la siguiente contiene voces en inglés con pronunciaciones de oraciones.