Quando eu era um jovem cientista, tive o privilégio de liderar a equipe envolvida na criação do implante coclear moderno, que de diversas formas restaurou a audição de aproximadamente 800 mil pessoas com surdez profunda.
A informação bruta contida nos sons da linguagem são transmitidas ao cérebro pelo dispositivo por meio da estimulação das fibras nervosas auditivas remanescentes. Isso é suficiente para que a notável maquinaria plástica do nosso cérebro a reinterprete como uma fala com som normal.

Dr. Michael Merzenich, Ph.D.
Mas e a grande quantidade de indivíduos que conseguem ouvir a fala, mas são incapazes de responder verbalmente? Esses pacientes se enquadram em duas grandes classes. Muitos sofreram lesões cerebrais graves que destruíram fisicamente as habilidades de produção da fala em seus cérebros. Em outros, o “maquinário” cortical de produção da fala está intacto, mas, devido a lesões físicas no trato vocal (por câncer, trauma ou lesão no tronco cerebral), ele é neurologicamente disfuncional.
Há quase 20 anos, conheci uma criança — vamos chamá-la de Katy — que era um encanto na minha família. Perto do quarto aniversário, uma babá estava concentrada na irmãzinha da menina enquanto Katy brincava no escorregador do parquinho com sua corda de pular. Num acidente muito esquisito, Katy acabou enroscando a corda em seu pescoço. Quando ela foi socorrida, os danos no tronco cerebral já tinham resultado em paralisia geral e na perda “permanente” de sua capacidade de fala. Agora, Katy é uma jovem adulta que usa cadeira de rodas. Ela tem alguma compreensão do que ouve, mas quase nenhuma capacidade de transmitir oralmente seus sentimentos ou pensamentos. Imagino que que ela tenha alguns gritos (silenciosos) dentro de si.
Interface cérebro-computador
Na mesma época, um jovem estudante brilhante apareceu no meu laboratório de neurociências motivado a aprender mais sobre o cérebro e a sua plasticidade. O Dr. Edward Chang, Ph.D., como eu previ, se tornou um médico neurocirurgião de destaque internacional e agora é professor e presidente do Departamento de Neurocirurgia da University of California, nos Estados Unidos. Durante mais de uma década, o Dr. Edward e a sua equipe de pesquisa fizeram uma pergunta simples: podemos registar informações que representem com precisão o que uma pessoa muda está tentando dizer e usar essas informações para restaurar a sua voz? Conforme publicado recentemente no periódico Nature, a resposta parece ser “sim”.
Conceitualmente, a estratégia é relativamente simples. Ao registrar o funcionamento de áreas densamente distribuídas pelas superfícies da região cortical — que controla a produção da fala e a expressão facial relacionada —, eles conseguem definir analiticamente o que o paciente está tentando dizer, mesmo quando as “saídas” do cérebro do paciente não chegam a lugar algum.
A equipe do Dr. Edward poderia ter feito com que essa interpretação dos sinais registrados em 253 locais do cérebro fosse transformada em texto numa tela ou em fala emitida por um alto-falante montado no rosto ou no crânio do paciente. Porém os pesquisadores escolheram usar um avatar de vídeo. Por meio dele, o paciente pode expressar sua fala e combiná-la com movimentos apropriados dos lábios e da boca — e quando solicitado, fazer um sorriso, uma careta, uma expressão de escárnio ou uma risadinha que transmitisse mais plenamente suas intenções. Ao registrar a dinâmica da expressão facial, o avatar também permite modular a fala para expressar ainda melhor as emoções do paciente.
Uma demonstração de como funciona a interface cérebro-computador da UCSF
Essa interface entre cérebro e inteligência artificial funcionou em um primeiro paciente, com alta taxa de precisão de produção de fala (≈ 95%). Ainda existem desafios importantes para tornar a ferramenta prática para uso mais amplo. A parte de registro da resposta cerebral do dispositivo precisa ser projetada para ser totalmente implantável, com componentes eletrônicos recarregáveis que permitam a comunicação sem fio com hardware portátil de exibição analítica, acústica e visual. O desenvolvimento do programa está agora focado em melhorar a velocidade de precisão da resposta neurológica do sinal ao avatar. Atualmente, ela é cerca de metade da velocidade normal de fala.
Paralelamente, a equipe do Dr. Edward está treinando os pacientes para implantar a plasticidade cerebral inerente, a fim de melhorar ainda mais a precisão e a velocidade de produção de fala, expressões faciais e voz modulada por emoção.
Acredito que é possível enfrentar esses desafios e que, dentro de alguns anos, um dispositivo de confiança e viável estará disponível.
Matrizes de microeletrodos mais profundas no cérebro
Uma abordagem alternativa à da equipe do Dr. Edward usa grades de microeletrodos introduzidos verticalmente nas camadas intermediárias ou nas profundezas do fino manto cortical cerebral. Este posicionamento permite que os pesquisadores registrem informações de controle de movimento voluntário com mais especificidade do que é feito pelas densas matrizes superficiais de eletrocorticografia usadas nos dispositivos do primeiro grupo.
Na prática, esta vantagem substancial na qualidade da informação fornecida à análise da inteligência artificial deve ser ponderada em relação às desvantagens, como menor estabilidade do registo da resposta, vida útil média mais curta destes dispositivos mais invasivos e o trauma associado à introdução cirúrgica e à potencial remoção ou substituição dos microeletrodos. Num ensaio recente em que esta estratégia foi adotada por pesquisadores da Stanford University, nos EUA, os cientistas conseguiram transformar a fala auditiva em texto através do registro do córtex motor da fala. Tal como na experiência da equipe do Dr. Edward, a taxa de produção da fala foi cerca de metade da velocidade normal; a taxa de precisão foi um pouco menor, cerca de 75%.
Uma demonstração da interface cérebro-computador de Stanford com entrevistas com pesquisadores
Devido às limitações na estabilidade do registro, foi necessária calibração frequente para implementar esta abordagem. O menor tempo operacional antes da falha para as formas atuais destes dispositivos é um importante obstáculo para o seu uso futuro.
A equipe do Dr. Edward parece ter um caminho mais claro pela frente, pelo menos em curto prazo, para restaurar as vozes silenciosas dos pacientes. Essa tecnologia ainda nos permitirá reanimar braços, pernas e corpos paralisados.
De minha parte, prevejo um dia, não muito distante no futuro, em que visitarei Katy e poderei ouvir e ver seu avatar rir enquanto ela tenta contar a esse velho cientista as novidades interessantes do nosso mundo médico.
O Dr. Michael Merzenich, Ph.D., recebe crédito frequentemente por ter descoberto a plasticidade duradoura, sendo o primeiro a empregar a plasticidade para benefício humano (ele foi um dos inventores do implante coclear), e por seu pioneirismo no campo da plasticidade baseada em exercícios cerebrais por computador. Ele é professor emérito na University of California e recebeu o prêmio Kavli Laureate em Neurociência, tenho sido honrado por cada uma das Academias Nacionais de Ciências, Engenharia e Medicina dos EUA. Ele é também conhecido por sua participação em uma série de programas de televisão sobre o cérebro. Seu foco atual é o BrainHQ, um aplicativo de exercícios cerebrais.
Este conteúdo foi originalmente publicado no Medscape
Créditos:
Imagem principal: Imagem extraída de https://www.youtube.com/embed/iTZ2N-HJbwA?si=7fidWgtL2eyVYcsz com autorização da UCSF
Medscape © 2023 WebMD, LLC
As opiniões expressas aqui são de responsabilidade pessoal do autor e não representam necessariamente a posição da WebMD ou do Medscape.
Citar este artigo: Por trás da tecnologia de restabelecimento de fala e expressão - Medscape - 16 de novembro de 2023.
Comente