Nova técnica detecta e elimina alucinações e garante respostas verdadeiras em IA

Publicado por

Isabella Caminoto

20 de junho de 2024 14:00

Pesquisadores da Universidade de Oxford desenvolveram um método para identificar quando um modelo de linguagem artificial (IA) corre o risco de “alucinar”, gerando respostas falsas ou imprecisas, segundo novo estudo publicado na revista Nature.

O termo “alucinação” em IA se refere àquelas saídas aparentemente convincentes, mas incorretas, produzidas por modelos de linguagem grandes (LLMs) como o GPT-3 da OpenAI ou o Claude da Anthropic. Essas falhas podem ser particularmente problemáticas em áreas como medicina, notícias e questões jurídicas.

“Alucinação é uma categoria ampla que pode significar quase qualquer tipo de erro de um LLM. Nosso foco está em casos onde o LLM erra sem motivo aparente, e não por ter sido treinado com dados ruins”, explica o Dr. Sebastian Farquhar, do Departamento de Ciência da Computação da Universidade de Oxford.

“Abordagens anteriores não diferenciavam a incerteza do modelo sobre o que dizer da incerteza sobre como dizer. Nosso método supera essa limitação”, acrescenta Farquhar.

Chatbots de IA também podem ter ‘alucinações’; entenda

No Dia dos Namorados deste ano, o repórter Kevin Roose teve uma interação perturbadora com o chatbot integrado no motor de busca alimentado por inteligência artificial (IA) da Microsoft, o Bing. Saiba mais!

A nova técnica mede a incerteza ou variabilidade no significado das saídas por meio da entropia semântica. Ou seja, analisa a incerteza no significado das respostas, e não apenas a sequência de palavras.

Por exemplo, se um LLM recebe uma pergunta e gera várias respostas possíveis, a entropia semântica avalia o quão diferentes esses significados são entre si. Entropia baixa indica alta confiança no sentido pretendido, enquanto entropia alta indica incerteza sobre o significado correto.

“Ao pedir a um LLM para responder a uma pergunta várias vezes, podemos comparar as respostas entre si”, diz Farquhar. “Antigamente, não se considerava o fato de que a linguagem natural permite dizer a mesma coisa de várias maneiras. Isso difere de outras situações de aprendizado de máquina onde as saídas do modelo são inequívocas”.

Testada em seis LLMs, incluindo GPT-4 e LaMDA 2, a nova técnica se mostrou mais eficaz na identificação de perguntas propensas a gerar respostas falsas, como pesquisas do Google, questões biomédicas técnicas e problemas matemáticos.

Embora exija mais recursos computacionais que a geração simples de texto, a técnica oferece um avanço crucial. “Obter respostas dos LLMs é barato, mas a confiabilidade é o maior gargalo. Em situações onde a precisão é crítica, calcular a incerteza semântica é um preço ínfimo”, conclui o Professor Yarin Gal, autor sênior do estudo.

A alucinação é uma das principais críticas aos LLMs. O Google recentemente desativou seu recurso de Visão Geral de IA após enfrentar reações negativas devido a respostas enganosas.

Leia também:

Vídeo em IA: Saiba mais sobre essa nova etapa do mercado audiovisual

Este post foi modificado pela última vez em 20 de junho de 2024 12:41

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Próximo Redes sociais do futuro: Bem-vindos à Era da IA »

Anterior « Claude 3.5 Sonnet: Anthropic lança novo modelo de IA e aposta em produtividade

Publicado por

Isabella Caminoto

Tags: alucinaçõesentropia semânticaIA generativainteligência artificialLLMs

20 de junho de 2024 14:00

Posts recentes

Inteligência Artificial

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

A inteligência artificial (IA) já começa a transformar hospitais, consultórios e sistemas de saúde, assumindo…

10 de julho de 2026

Inteligência Artificial

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

A OpenAI apresentou oficialmente o GPT-5.6, sua mais nova geração de modelos de inteligência artificial…

29 de junho de 2026

Inteligência Artificial

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

A OpenAI deu um passo que pode redefinir o equilíbrio de poder no setor de…

25 de junho de 2026

Inteligência Artificial

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Inteligência Artificial

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…

22 de junho de 2026

Inteligência Artificial

Data centers no espaço? Musk revela plano para levar a IA à órbita terrestre

A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…

14 de junho de 2026

Nova técnica detecta e elimina alucinações e garante respostas verdadeiras em IA

Posts relacionados

Posts recentes

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

Data centers no espaço? Musk revela plano para levar a IA à órbita terrestre