摘要:La disartria es una discapacidad motora del habla caracterizada por debilidad o poca coordi- nación de los músculos del habla. Esta condición puede ser causada por un infarto, parálisis cerebral, o por una lesión severa en el cerebro. Para mexicanos con esta condición hay muy pocas, si es que hay alguna, tecnologías de asistencia para mejorar sus habilidades sociales de interacción. En este artículo presentamos nuestros avances hacia el desarrollo de una interfaz de comunicación para hablantes con disartria cuya lengua materna sea el español mexicano. La metodología propuesta depende de (1) diseño especial de un corpus de entrenamiento con voz normal y recursos limitados, (2) adaptación de usuario estándar, y (3) control de la perplejidad del modelo de lenguaje para lograr alta precisión en el Reconocimiento Automático del Habla (RAH). La interfaz permite al usuario y terapéuta el realizar actividades como adaptación dinámica de usuario, adaptación de vocabulario, y síntesis de texto a voz. Pruebas en vivo fueron realizadas con un usuario con disartria leve, logrando precisiones de 93%-95% para habla espontánea.
其他摘要:Dysarthria is a motor speech disorder due to weakness orpoor coordination of the speech muscles. This condition can be caused by a stroke, cerebral palsy, or by a traumatic brain injury. For Mexican people with this condition there are few, if any, assistive technologies to improve their social interaction skills. In this paper we present our advances towards the development of a communication interface for dysarthric speakers whose native language is Mexican Spanish. We propose a methodology that relies on (1) special design of a training normal-speech corpus with limited resources, (2) standard speaker adaptation, and (3) control of language model perplexity, to achieve high Automatic Speech Recognition (ASR) accuracy. The interface allows the user and therapist to perform tasks such as dynamicspeaker adaptation, vocabulary adaptation, and text-to-speech (TTS) synthesis. Live tests wereperformed with a mildly dysarthric speaker, achieving accuracies of 93%-95% for spontaneous speech.