Caracas.-Por primera vez en la historia, un equipo de neuroingenieros de la Universidad de Columbia (EE. UU.) ha creado un sistema que traduce el pensamiento en un discurso inteligible y reconocible. Al monitorear la actividad cerebral de una persona, esta innovadora tecnología puede reconstruir las palabras que un individuo escuche con una claridad sin precedentes.
Este avance, que aprovecha el poder de los sintetizadores de voz y la inteligencia artificial, podría llevar a nuevas formas para que las máquinas se comuniquen directamente con el cerebro. También sienta las bases para ayudar a las personas que no pueden hablar, como las que viven con esclerosis lateral amiotrófica (ELA) o que se están recuperando de un derrame cerebral, para recuperar su capacidad de comunicarse con el mundo exterior.
“Nuestras voces nos ayudan a conectarnos con nuestros amigos, familiares y con el mundo que nos rodea, por lo que perder el poder de la voz debido a una lesión o enfermedad es devastador”, dijo la investigadora Nima Mesgarani. “Con el estudio de hoy, tenemos una forma potencial de restaurar ese poder. “Hemos demostrado que, con la tecnología adecuada, cualquier oyente puede descifrar y entender los pensamientos de estas personas”.
El estudio, que ha sido publicado en la revista Scientific Reports, comenzó con un algoritmo informático capaz de reconstruir lo que una persona está oyendo y transmitirlo con una voz robótica como el habla humana.
“Esta es la misma tecnología utilizada por Amazon Echo y Apple Siri para dar respuestas verbales a nuestras preguntas”, explicó Mesgarani.
Pruebas
Luego, los investigadores pidieron a cinco pacientes con epilepsia sometidos a cirugía cerebral que escucharan a alguien que pronunciara oraciones mientras que los investigadores buscaban patrones neuronales en la actividad cerebral de los pacientes. Los científicos utilizaron esos patrones para entrenar su algoritmo, al que llamaron “vocoder”, que traduce las ondas cerebrales en habla.
Después de esto, llegó el momento de probar cómo de bien traducía los pensamientos la máquina ya entrenada. Por ello, pidieron a un grupo de pacientes con epilepsia que escucharan a alguien que recitaba los números del cero al nueve, mientras que el equipo grababa sus señales cerebrales. Los investigadores realizaron las grabaciones a través del algoritmo, luego hicieron que una red neuronal especialmente entrenada analizara y “limpiara” la salida.
Finalmente, el equipo pidió a 11 personas que escucharan dicho discurso para probar su inteligibilidad.
“Encontramos que las personas podían entender y repetir los sonidos aproximadamente el 75% del tiempo, lo que está muy por encima y más allá de cualquier intento anterior”, aclaró Mesgarani. “Vocoder y las poderosas redes neuronales representaban los sonidos que los pacientes habían escuchado originalmente con sorprendente precisión”, apunta el investigador.
Fuente