De sinais cerebrais para fala
Duas equipes independentes apresentaram avanços marcantes nas interfaces cérebro-computador.
Nos dois casos, os dispositivos são capazes de decodificar a atividade cerebral e gerar falas sintetizadas por um computador. E ambas fazem isto com mais rapidez, maior precisão e abrangendo um vocabulário maior do que as tecnologias anteriores.
Pessoas com distúrbios neurológicos, incluindo derrame do tronco cerebral ou esclerose lateral amiotrófica, muitas vezes enfrentam perda da fala devido à paralisia dos músculos.
Estudos anteriores mostraram que é possível decodificar a fala das atividades cerebrais de uma pessoa com paralisia, mas apenas na forma de texto e com velocidade, precisão e vocabulário limitados.
Francis Willett e seus colegas da Universidade de Stanford desenvolveram uma interface cérebro-computador que coleta a atividade neural de células individuais com uma série de eletrodos finos inseridos no cérebro. Uma rede neural artificial decodifica esses sinais e gera as vocalizações pretendidas.
Com a ajuda do dispositivo, um paciente com esclerose lateral amiotrófica conseguiu se comunicar a uma taxa média de 62 palavras por minuto, o que é 3,4 vezes mais rápido do que o recorde anterior de um aparelho semelhante, e se aproxima da velocidade de uma conversa natural, que é de cerca de 160 palavras por minuto.
A interface alcançou uma taxa de erro de palavra de 9,1% em um vocabulário de 50 palavras, o que é 2,7 vezes menos erros do que a interface de fala de última geração, que havia sido apresentada em 2021. Uma taxa de erro de palavra de 23,8% foi alcançada em um vocabulário de 125.000 palavras.
Escrita, fala e avatar
Sean Metzger e colegas da Universidade da Califórnia de São Francisco, por sua vez, usaram um método diferente para acessar a atividade cerebral, usando eletrodos não penetrantes que ficam na superfície do cérebro, detectando a atividade de um grande número de células em todo o córtex da fala.
Esta interface decodifica os sinais cerebrais para gerar três saídas simultaneamente: Texto, fala audível e um avatar falante.
Os pesquisadores treinaram um modelo de aprendizado profundo para decifrar os dados neurais coletados de uma paciente com paralisia grave, causada por um derrame cerebral, enquanto ela tentava falar silenciosamente frases completas. A tradução de sinal cerebral para texto gerou uma taxa média de 78 palavras por minuto, o que é 4,3 vezes mais rápido do que o recorde anterior e se aproxima ainda mais da velocidade de uma conversa natural.
Esta interface alcançou uma taxa de erro de palavra de 4,9% ao decodificar sentenças de um conjunto de 50 frases, o que é 5 vezes menos erros do que a melhor interface anterior. Uma taxa de erro de palavra de 25% foi alcançada ao decodificar frases em tempo real, com um vocabulário de mais de 1.000 palavras, e as simulações offline mostraram uma taxa de erro de palavra de 28% usando um vocabulário com mais de 39.000 palavras.
Os dois equipamentos representam um grande avanço na pesquisa neurocientífica e de neuroengenharia, trazendo esperanças para aliviar o sofrimento de indivíduos que perderam a voz como resultado de lesões e doenças neurológicas. Contudo, os métodos ainda são invasivos e, ao menos por enquanto, só visam pacientes muito graves, que já estejam passando por cirurgias de crânio aberto.
Ver mais notícias sobre os temas: | |||
Neurociências | Cérebro | Robótica | |
Ver todos os temas >> |
A informação disponível neste site é estritamente jornalística, não substituindo o parecer médico profissional. Sempre consulte o seu médico sobre qualquer assunto relativo à sua saúde e aos seus tratamentos e medicamentos.
Copyright 2006-2024 www.diariodasaude.com.br. Todos os direitos reservados para os respectivos detentores das marcas. Reprodução proibida.