Imagine se você pudesse se comunicar com qualquer pessoa sem dizer uma palavra, apenas pensando. Essa é a promessa de uma nova tecnologia desenvolvida por pesquisadores da Universidade de Tecnologia de Sydney (UTS), que criaram um sistema portátil e não invasivo capaz de decodificar pensamentos silenciosos e transformá-los em texto.
A tecnologia, chamada DeWave, utiliza um boné de eletroencefalograma (EEG) para registrar a atividade elétrica do cérebro através do couro cabeludo. Em seguida, emprega um modelo de inteligência artificial (IA) para segmentar a onda do EEG em unidades distintas que capturam características e padrões específicos do cérebro humano. O DeWave traduz essas unidades em palavras e frases ao aprender a partir de grandes quantidades de dados de EEG.
A tecnologia poderia auxiliar na comunicação de pessoas que não conseguem falar devido a doença ou lesão, como acidente vascular cerebral ou paralisia. Também poderia possibilitar uma comunicação sem interrupções entre humanos e máquinas, como a operação de um braço biônico ou robô.
Além disso, a tecnologia é mais acessível e conveniente do que métodos anteriores de traduzir sinais cerebrais para linguagem, que geralmente exigiam cirurgia para implantar eletrodos no cérebro, ou exames em uma máquina de ressonância magnética (MRI), que é grande, cara e difícil de usar no dia a dia.
DeWave é a primeira tecnologia a incorporar técnicas de codificação discreta no processo de tradução de cérebro para texto, introduzindo uma abordagem inovadora para decodificação neural. A integração com grandes modelos de linguagem também está abrindo novas fronteiras na neurociência e na inteligência artificial, de acordo com os pesquisadores.
A tecnologia foi testada com 29 participantes que leram silenciosamente trechos de texto enquanto usavam o boné de EEG. Os pesquisadores descobriram que o DeWave foi capaz de traduzir sinais de EEG em palavras e frases com um alto grau de precisão, superando benchmarks anteriores.
Além disso, a tecnologia foi capaz de traduzir sinais de EEG sem a necessidade de rastreamento ocular, frequentemente usado como um auxílio adicional para segmentar sinais cerebrais em unidades de nível de palavra. Isso significa que a tecnologia pode ser usada com ou sem rastreamento ocular, dependendo da preferência e condição do usuário.
Os pesquisadores também observaram que a tecnologia era mais hábil em combinar verbos do que substantivos e que às vezes produzia pares sinônimos em vez de traduções precisas, como ‘o homem’ em vez de ‘o autor’. Eles explicaram que isso pode ser porque palavras semanticamente similares podem produzir padrões de ondas cerebrais semelhantes.
Os pesquisadores esperam melhorar o índice de precisão de tradução da tecnologia, que está atualmente em torno de 40% no BLEU-1, uma medida de similaridade entre texto traduzido por máquina e traduções de referência humanas. Eles têm como objetivo alcançar um nível comparável aos programas tradicionais de tradução de idiomas ou reconhecimento de fala, que se aproximam de 90%.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 14:38
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…