文章基本信息

标题：Communication Interface for Mexican Spanish Dysarthric Speakers.
本地全文：下载
作者：Gladys Bonilla-Enriquez ; Santiago-Omar Caballero-Morales
期刊名称：Acta Universitaria
印刷版ISSN：0188-6266
出版年度：2012
卷号：22
页码：98-105
语种：English
出版社：Universidad de Guanajuato
摘要：La disartria es una discapacidad motora del habla caracterizada por debilidad o poca coordi- nación de los músculos del habla. Esta condición puede ser causada por un infarto, parálisis cerebral, o por una lesión severa en el cerebro. Para mexicanos con esta condición hay muy pocas, si es que hay alguna, tecnologías de asistencia para mejorar sus habilidades sociales de interacción. En este artículo presentamos nuestros avances hacia el desarrollo de una interfaz de comunicación para hablantes con disartria cuya lengua materna sea el español mexicano. La metodología propuesta depende de (1) diseño especial de un corpus de entrenamiento con voz normal y recursos limitados, (2) adaptación de usuario estándar, y (3) control de la perplejidad del modelo de lenguaje para lograr alta precisión en el Reconocimiento Automático del Habla (RAH). La interfaz permite al usuario y terapéuta el realizar actividades como adaptación dinámica de usuario, adaptación de vocabulario, y síntesis de texto a voz. Pruebas en vivo fueron realizadas con un usuario con disartria leve, logrando precisiones de 93%-95% para habla espontánea.
其他摘要：Dysarthria is a motor speech disorder due to weakness orpoor coordination of the speech muscles. This condition can be caused by a stroke, cerebral palsy, or by a traumatic brain injury. For Mexican people with this condition there are few, if any, assistive technologies to improve their social interaction skills. In this paper we present our advances towards the development of a communication interface for dysarthric speakers whose native language is Mexican Spanish. We propose a methodology that relies on (1) special design of a training normal-speech corpus with limited resources, (2) standard speaker adaptation, and (3) control of language model perplexity, to achieve high Automatic Speech Recognition (ASR) accuracy. The interface allows the user and therapist to perform tasks such as dynamicspeaker adaptation, vocabulary adaptation, and text-to-speech (TTS) synthesis. Live tests wereperformed with a mildly dysarthric speaker, achieving accuracies of 93%-95% for spontaneous speech.
关键词：Dysarthric speech; assistive technology; automatic speech recognition;Habla disártica; tecnología asistiva; reconocimiento automático del habla