La Inteligencia Artificial restituye la voz que la enfermedad había robado

La Inteligencia Artificial restituye la voz que la enfermedad había robado

 

Las aplicaciones que se están derivando de la tecnología de Inteligencia Artificial Generativa no las imaginábamos y esto solo parece ser solo el inicio de un nuevo mundo. Hace pocos años parecía ciencia ficción que una persona que sufría de ELA (esclerosis lateral amiotrófica) pudiera recuperar el habla y acá haremos una descripción de una experiencia exitosa reciente.





Especial de Laszlo Beke

Hoy en día se está experimentando la conexión del cerebro con la máquina con dispositivos como el Neuralink de Elon Musk, los cuales ayudan a las personas a mover cursores en una pantalla. En este caso se trata de un implante que le permite al paciente explorar el terreno infinitamente más complejo de la recuperación del habla.

Hace cuatro años un hombre de 46 años que sufría de ELA, después de perder la habilidad de caminar, de sostener a su hija, de voltear las páginas de un libro, también terminó perdiendo la capacidad de cantar una canción de cuna. El pasado mes de Julio 2023, los médicos le implantaron quirúrgicamente unos electrodos con el objetivo de intentar discernir aquello que intentaba decir. Era una búsqueda científica, potencialmente desalentadora, de trataba de conectar el cerebro de una persona a una computadora. El planteamiento que se le hizo al paciente es que se estarían haciendo avances para la causa de la ciencia, pero que difícilmente lo ayudaría a él. Los resultados excedieron las expectativas, ilustrando el potencial de los decodificadores de voz implantados para las personas con deficiencia en el habla.

En la capa externa del cerebro del paciente se incrustaron cuatro arreglos de electrodos, similares a camas mínimas con clavos. Eso era el doble de lo que se había implantado previamente en áreas de la voz para alguien con ELA. Las 64 puntas de los arreglos recogían impulsos de neuronas que se disparaban cuando el paciente intentaba mover para hablar la boca, los labios, la quijada y la lengua. Tres semanas después de la operación, los científicos se reunieron en la sala de la casa del paciente para “conectar” el implante a un banco de computadoras con cables fijados a dos postes de metal, que salían del cráneo del paciente.

Después de un corto entrenamiento de las computadoras para reconocer el habla del paciente, el implante comenzó a grabar aquello que este trataba de decir partiendo de un vocabulario de 50 palabras con una precisión de 99.6%. El dispositivo comenzó a funcionar tan bien que los científicos incluso eliminaron una sesión inicial de análisis. En el medio del primer intento para hablar, el paciente sonrió y comenzó a llorar. Las palabras que trataba de emitir el paciente eran inentendibles. Sin embargo, los electrodos, entonados con las neuronas, los convertían en palabras perfectamente entendibles. Una pantalla frente al paciente le mostraba aquello que intentaba decir. El dispositivo se basaba en la información de la corteza motor desde donde el paciente iniciaba las instrucciones, en lugar de hacerlo desde los debilitados músculos faciales. Una clave innovadora fue incrementar el conjunto de arreglos, apuntando con mayor precisión a las partes del cerebro asociadas con el habla.

Para el segundo día, la máquina ya se encontraba operando a través de un vocabulario de 125.000 palabras con una precisión de 90% y produciendo por primera vez oraciones creadas por el paciente. La voz del dispositivo era sorprendentemente parecida a la del paciente. Utilizando grabaciones del pasado, los investigadores habían creado un “deep fake” de la voz pre-ELA del paciente. En la medida que los científicos continuaban el entrenamiento de reconocimiento de sonidos, el dispositivo mejoraba. A través de ocho meses del estudio, el paciente llegó a emitir 6.000 palabras únicas y diferentes. El dispositivo mantuvo una precisión de 97.5%, cuando anteriormente era de 75%, y además esto excede la precisión de muchas de las aplicaciones de teléfonos inteligentes que transcriben el habla. Partiendo de una demostración científica, pasó a ser un instrumento que el paciente utiliza para hablar diariamente con su familia y amigos.

El impacto de Inteligencia Artificial Generativa

El inmenso salto tecnológico que se ha logrado se debe en parte a los diferentes tipos de Inteligencia Artificial que potencian herramientas como ChatGPT. En cualquier momento, que el implante detecta actividad en un conjunto de neuronas, traduce el patrón de señales o disparos en una vocal o una consonante. Las computadoras pueden aglomerar una serie de sonidos en una serie de palabras y posteriormente en una oración, seleccionando el resultado que consideran que tiene mayor posibilidad de corresponder a lo que el paciente está intentando decir.

Para el paciente, la principal diferencia en su voz decodificada la representan la proclividad del sistema a producir oraciones completas y los investigadores también empujaban a la herramienta de IA a reconocer las frases poco comunes que el paciente tendía a utilizar. El decodificador también le permitió al paciente recuperar elementos antiguos que habían desaparecido. La máquina, en ocasiones, parecía emular su antigua personalidad. Muchas de las palabras sonaban exactamente como él las decía. El impacto del implante también cambió como otros lo percibían. Personal del sector salud que lo visitaba y que habían pensado que el paciente era estúpido o que tenía dificultades para oír, ahora le hablan con volúmenes normales y lo tocan con más cuidado. Su nuevo estado le permitió al paciente recuperar elementos de su antigua vida social. Ahora podía reestablecer contacto con viejos amigos.

No está claro si un implante similar pudiera ser útil para personas severamente paralizadas. El habla de este paciente se había deteriorado, pero no había desaparecido. El paciente ha podido trabajar de forma más productiva e independiente. Cada mañana hace una prueba con una oración, que no está asociada a un correo electrónico de trabajo, sino con una canción que le gustaría volver a cantar. Los científicos están trabajando para tratar de que lo logre.


Se hace referencia a A.L.S. Stole His Voice. A.I. Retrieved It. También aparece en mi Portal https://tinyurl.com/24d7k5eu.