Imagine se você pudesse se comunicar com qualquer pessoa sem dizer uma palavra, apenas pensando. Essa é a promessa de uma nova tecnologia desenvolvida por pesquisadores da Universidade de Tecnologia de Sydney (UTS), que criaram um sistema portátil e não invasivo capaz de decodificar pensamentos silenciosos e transformá-los em texto.
A tecnologia, chamada DeWave, utiliza um boné de eletroencefalograma (EEG) para registrar a atividade elétrica do cérebro através do couro cabeludo. Em seguida, emprega um modelo de inteligência artificial (IA) para segmentar a onda do EEG em unidades distintas que capturam características e padrões específicos do cérebro humano. O DeWave traduz essas unidades em palavras e frases ao aprender a partir de grandes quantidades de dados de EEG.
A tecnologia poderia auxiliar na comunicação de pessoas que não conseguem falar devido a doença ou lesão, como acidente vascular cerebral ou paralisia. Também poderia possibilitar uma comunicação sem interrupções entre humanos e máquinas, como a operação de um braço biônico ou robô.
Além disso, a tecnologia é mais acessível e conveniente do que métodos anteriores de traduzir sinais cerebrais para linguagem, que geralmente exigiam cirurgia para implantar eletrodos no cérebro, ou exames em uma máquina de ressonância magnética (MRI), que é grande, cara e difícil de usar no dia a dia.
DeWave é a primeira tecnologia a incorporar técnicas de codificação discreta no processo de tradução de cérebro para texto, introduzindo uma abordagem inovadora para decodificação neural. A integração com grandes modelos de linguagem também está abrindo novas fronteiras na neurociência e na inteligência artificial, de acordo com os pesquisadores.
A tecnologia foi testada com 29 participantes que leram silenciosamente trechos de texto enquanto usavam o boné de EEG. Os pesquisadores descobriram que o DeWave foi capaz de traduzir sinais de EEG em palavras e frases com um alto grau de precisão, superando benchmarks anteriores.
Além disso, a tecnologia foi capaz de traduzir sinais de EEG sem a necessidade de rastreamento ocular, frequentemente usado como um auxílio adicional para segmentar sinais cerebrais em unidades de nível de palavra. Isso significa que a tecnologia pode ser usada com ou sem rastreamento ocular, dependendo da preferência e condição do usuário.
Os pesquisadores também observaram que a tecnologia era mais hábil em combinar verbos do que substantivos e que às vezes produzia pares sinônimos em vez de traduções precisas, como ‘o homem’ em vez de ‘o autor’. Eles explicaram que isso pode ser porque palavras semanticamente similares podem produzir padrões de ondas cerebrais semelhantes.
Os pesquisadores esperam melhorar o índice de precisão de tradução da tecnologia, que está atualmente em torno de 40% no BLEU-1, uma medida de similaridade entre texto traduzido por máquina e traduções de referência humanas. Eles têm como objetivo alcançar um nível comparável aos programas tradicionais de tradução de idiomas ou reconhecimento de fala, que se aproximam de 90%.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 14:38
A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…
A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…
Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…