Anteproyecto de sistema de reconocimiento del habla
para dialogar con una persona sorda.
 
           Atrás - Home

Objetivo.- Se trata de facilitar el diálogo entre dos personas, una de las cuales (o las dos) es completamente sorda.

Supongamos que una persona completamente sorda quiere entablar una conversación con alguien que acaba de llegar. El sordo no domina la lectura labial y, ni el sordo ni la visita conocen el lenguaje de signos. La única solución es recurrir al papel y al lápiz; pero eso es lento, requiere un esfuerzo por parte de la visita (que no todas las visitas están dispuestas a hacer) y carece de la espontaneidad de una charla (el simple hecho de escribir modifica el contenido del texto, aunque se advierta a la visita que el papel, una vez leído, se rompe)

Creo que un sistema de reconocimiento del habla, empleando un ordenador y un micrófono, debiera ser capaz de cumplir este objetivo.

Antecedentes.- He ensayado el VoiceType Gold de IBM y el Naturally Speaking Standard de Dragon Systems. Ninguno de los dos resuelve el problema, por dos razones:

1)                   Requieren un largo entrenamiento que no todas las visitas están dispuestas a soportar (mucho mas de una hora con VoiceType; mas de ¾ de hora con Naturally Speaking)

2)                     Estos sistemas, al pretender escribir un castellano gramatical y ortográficamente correcto, buscan la palabra correcta mas parecida a lo que oyó el micrófono; en una carta comercial esto no tiene ninguna repercusión negativa (solo positiva), pero en una charla amistosa, con  sus giros y hasta palabras que no están en el diccionario de la R.A.E., las “palabras correctas” que aparecen impiden averiguar lo que se ha hablado.

En IBM me han asegurado que el ViaVoice Release 8 es mucho mejor y debiera resolver el problema. No lo creo, pues, aunque me aseguren que solo requiere 10 minutos de entrenamiento ¿será cierto?, queda la segunda razón (falseamiento del texto) De todas formas, tengo intención de probarlo en cuanto IBM se digne enviármelo (lo he comprado en www-5.ibm.com/shop, donde corren mucho en cobrar pero, después de mes y medio, aún no han enviado el producto)

Propuesta de solución.- Si el sistema de reconocimiento del habla se olvidase de las palabras y se limitase a reconocer las sílabas, pienso que todos estos inconvenientes desaparecerían: El español tiene solamente alrededor de 460 sonidos silábicos diferentes. Al sistema le bastaría memorizar estas 460 voces, comparar lo que oye con ellas y escribir la mas parecida. Quizás esto no requiera ningún entrenamiento de la “visita”, o, como mucho, 2 ó 3 minutos.

Pero esta idea requiere un “pago”: Hay que evitar toda posible ambigüedad; no se puede escribir “ba” unas veces y “va” otras, habrá que escribir siempre “ba” (aunque se trate de Balencia); el sonido de la “k” habrá que escribirlo siempre igual (kama en vez de cama, ke en vez de que,...); la “j” debe sustituir a la “g” fuerte, reservando la “g” para el sonido débil (jente en vez de gente, pliege en vez de pliegue); la “c” débil es igual que la “z” (zesto en vez de cesto); sobran muchas letras (c, h, q, v, w, y); la “ch”, la “ll” y la “rr” deben conservarse; la “x” probablemente también sobre, pues aunque “x” y “s” deben pronunciarse distinto, muchas veces suenan igual y se entiende aunque se escriba “s” (escursión por ejemplo)

Los huecos entre palabras y los acentos, si el sistema los percibe, que los ponga; si no, no pasa nada (se sigue entendiendo)

Resulta así un escrito fonéticamente correcto, lleno de faltas de ortografía, pero que se lee sin ninguna dificultad y, sobre todo, que reproduce fielmente lo que se ha hablado.

Como ejemplo, copio un trozo de 4 párrafos mas arriba: “Si el sistema de rekonozimiento del abla se olbidase de las palabras i se limitase a rekonocer las silabas, pienso ke todos estos inkonbenientes desaparezerian”

Sería de desear que el sistema no permitiese imprimir, que sea una sola página que se va borrando por arriba cuando crece por abajo. La razón es doble: nadie se sentiría molesto al ver escrita tal colección de faltas de ortografía y la “visita” hablaría con mas confianza y espontaneidad al ver que (igual que cuando se habla) las palabras se las lleva el viento.

Desde el punto de vista del sordo, este sistema sería mil veces mejor que la lectura labial (que es lo que nos recomiendan aprender a todos los sordos) La lectura labial es también silábica, pero de cada sílaba solo se distingue con relativa claridad la vocal; las consonantes se agrupan en familias sin que pueda saberse exactamente cual es (por ejemplo “ba”, “ma” y “pa” tienen la misma expresión en la cara)

Nota: Esta propuesta la he enviado a Dragon Systems y a IBM. Ninguno de los dos ha contestado hasta hoy.

 

 2 de junio de 2001
             Alberto Catalina
             4 Impasse de Tanya 66740 Laroque des Albères (Francia)
             E-Mail:   Alberto.Catalina@wanadoo.fr

 

 

Sitiodesordos.com.ar