Scanner cerebral equipado com IA pode interpretar e reescrever pensamentos, abrindo caminho para avanços significativos na comunicação. Embora apresente possíveis vantagens em termos de comunicação, especialistas alertam sobre as possíveis consequências relacionadas à “privacidade mental”.
Acadêmicos da Universidade do Texas em Austin conceberam um “decodificador semântico” revolucionário, cuja função é converter imagens da atividade da fala no cérebro humano em texto parafraseado, utilizando inteligência artificial.
Embora haja limitações de precisão, quando comparado ao texto original, esta descoberta representa uma grande conquista no avanço do papel da IA em tecnologia assistiva. Contudo, os fabricantes alertam que, sem regulamentação apropriada, a tecnologia pode ser mal utilizada.
O estudo publicado na Nature Neuroscience na segunda-feira detalha uma nova tecnologia que combina um programa generativo semelhante ao GPT-4 da OpenAI e ao Google Bard com uma tecnologia existente capaz de interpretar varreduras de ressonância magnética funcional (fMRI).
O fMRI é um dispositivo utilizado para monitorar como e onde o sangue flui em áreas específicas do cérebro. Embora interfaces cérebro-computador (BCIs) anteriores tenham apresentado resultados promissores no que diz respeito a habilidades de tradução, a versão desenvolvida na UT Austin é considerada a primeira versão não invasiva que não requer implantes físicos ou fiação.
"Durante a pesquisa, os pesquisadores solicitaram que três participantes passassem um total de 16 horas dentro de uma máquina de ressonância magnética funcional (fMRI), ouvindo podcasts de áudio.
Enquanto isso, a equipe treinou um modelo de inteligência artificial para criar e analisar recursos semânticos, utilizando comentários do Reddit e textos autobiográficos. Através da fusão desses dois conjuntos de dados, a IA aprendeu a associar palavras e frases com as varreduras cerebrais dos participantes, criando assim ligações semânticas.
Posteriormente, os participantes foram submetidos a um novo estímulo sonoro que não havia sido utilizado na fase de treinamento. Durante a coleta de dados, o decodificador semântico converteu o áudio em texto com base nas varreduras da atividade cerebral. Além disso, o sistema foi capaz de produzir resultados semelhantes quando os participantes assistiam a videoclipes silenciosos ou imaginavam histórias mentais.
De acordo com o The New York Times, embora as transcrições geradas pela IA frequentemente fornecessem respostas imprecisas ou fora de contexto, elas ainda foram bem-sucedidas em parafrasear o monólogo interno dos participantes do estudo.
Em alguns casos, as transcrições refletiram com precisão as escolhas de palavras dos áudios originais. Esses resultados sugerem que o decodificador semântico da equipe da Universidade do Texas em Austin não apenas captura a ordem das palavras, mas também o significado subjacente.
Embora em seus estágios iniciais, os pesquisadores estão otimistas em relação às possibilidades futuras de desenvolvimento de versões aprimoradas que possam fornecer uma nova e poderosa ferramenta de comunicação para indivíduos que perderam a capacidade de falar de forma audível, como vítimas de derrame ou pessoas que sofrem de esclerose lateral amiotrófica (ELA).
Atualmente, os scanners fMRI são dispositivos volumosos e imóveis que estão restritos a instalações médicas. No entanto, a equipe de pesquisa planeja explorar como um sistema semelhante poderia ser implementado utilizando a espectroscopia funcional de infravermelho próximo (fNIRS).
Contudo, é crucial destacar uma estipulação relevante para o novo decodificador semântico – um sujeito deve conscientemente e concentradamente fazer um esforço para colaborar com os objetivos do programa de IA, mantendo o foco em seus objetivos.
Em outras palavras, um cérebro mais ocupado pode resultar em uma transcrição mais limitada. Além disso, a tecnologia do decodificador também é limitada ao treinamento em apenas uma pessoa por vez.
Ainda que existam essas restrições atuais, a equipe de pesquisa antecipa o potencial de progresso rápido ao lado do risco de uso indevido. Em seu estudo, a equipe afirmou que “desenvolvimentos [futuros] podem permitir que os decodificadores ignorem esses requisitos [de privacidade]”.
Além disso, apesar de as previsões do decodificador serem imprecisas sem a cooperação do sujeito, elas podem ser intencionalmente mal interpretadas para fins maliciosos, ameaçando a privacidade.