Gracias a un nuevo avance, los pacientes podrían recuperar su voz utilizando un dispositivo que analiza el contacto entre la lengua y el paladar.
Investigadores de Sudáfrica están trabajando en un nuevo tipo de laringe artificial que no tendrá la voz ronca de los dispositivos existentes. El sistema registra el contacto entre la lengua y el paladar para determinar qué palabra se está pronunciando y utiliza un sintetizador de voz para generar los sonidos.
De acuerdo con el National Cancer Institute, unos 10.000 estadounidenses son diagnosticados con cáncer de laringe de cada año y a la mayoría de los pacientes con cáncer avanzado hay que quitarles la caja vocal.
«Todos los dispositivos disponibles en la actualidad producen un sonido horroroso, o bien suena robótico o con voz ronca», señala Megan Russell, candidata doctoral de la Universidad de Witwatersrand en Johannesburgo, Sudáfrica. «Pensamos que teníamos a mano la tecnología para lograr una solución artificial de voz sintetizada».
El sistema utiliza un palatómetro: un dispositivo que se parece mucho a una placa de ortodoncia y normalmente se utiliza para la terapia del habla. El dispositivo, fabricado por CompleteSpeech de Orem, Utah, registra el contacto entre la lengua y el paladar por medio de 118 sensores táctiles integrados. El software para la laringe artificial fue escrito por Russell y sus colegas de la Universidad de Witwatersrand. Su trabajo será presentado en la Conferencia Internacional sobre Ingeniería Biomédica y Farmacéutica celebrada esta semana en Singapur.
Para utilizar el dispositivo, basta con que la persona se ponga el palatómetro en la boca y pronuncie las palabras con normalidad. El sistema intenta traducir esos movimientos de la boca en palabras antes de reproducirlos en un pequeño sintetizador de sonido escondido, tal vez, en un bolsillo de la camisa.
Por el momento, Russell ha entrenado al sistema para reconocer 50 palabras comunes en inglés pronunciando varias veces cada palabra con el palatómetro colocado en su boca. La información se puede representar en un gráfico espacio-tiempo binario y almacenar en una base de datos. Cada vez que el usuario habla, los patrones de contacto se contrastan con la base de datos para identificar la palabra correcta.
El equipo de Russell ha probado el sistema de identificación de palabras utilizando varias técnicas. Un enfoque consiste en alinear y hacer un promedio de los datos producidos durante el entrenamiento del dispositivo para unos cuantos casos de una palabra, con el fin de crear una plantilla para la comparación. Otro compara características como el área del trazado de los datos en el gráfico y el centro de masa en los ejes X e Y. Un sistema de voto compara los resultados de los métodos seleccionados para ver si coinciden. Los investigadores también han probado un sistema de análisis predictivo, que tiene en cuenta la última palabra pronunciada para ayudar a determinar la siguiente.
Según Russell, cuando se combinan los elementos obtenidos por predicción y votación, el sistema identifica la palabra correcta en el 94,14% de los casos, aunque esto no incluye las palabras que el sistema clasifica como «desconocidas» y elige saltárselas. Russell dice que eso sucede alrededor del 18% de los casos. Pero, según él, elegir una palabra errónea «podría conducir a situaciones sociales muy complicadas», por lo que es mejor que sistema rechace las palabras que no están claras y permanezca en silencio.
El equipo espera eliminar los cables planos del palatómetro que salen de la boca del usuario y, en su lugar, crear un sistema en el que los datos se transmitan de forma inalámbrica desde el palatómetro a un sintetizador de voz. El grupo necesita mejorar también el sistema de análisis predictivo y ampliar la base de datos de palabras.
El equipo de Russell también tendrá que probar el dispositivo en muchos más sujetos –incluso aquellos sin una laringe–, antes de que el dispositivo pueda salir al mercado.
Fuente: Technology Review