Inteligência Artificial

Chatbots fornecem informações falsas pelo menos 3% das vezes; veja comparação entre IAs

Quando a startup OpenAI apresentou o ChatGPT no final do ano passado, muitas pessoas ficaram impressionadas com sua capacidade de resposta humanizada a perguntas e discussões sobre diversos tópicos. No entanto, muitos não perceberam que esse novo tipo de chatbot frequentemente inventa informações.

Publicado por
Bárbara Pereira

A Vectara, uma nova startup fundada por ex-funcionários do Google, está pesquisando a frequência com que os chatbots se desviam da verdade. A pesquisa da empresa sugere que os chatbots inventam informações pelo menos 3% das vezes. Essa taxa pode ser ainda mais alta quando os chatbots realizam tarefas mais complexas do que apenas resumir informações.

Especialistas chamam esse comportamento de “alucinação” do chatbot. Embora possa não ser um problema para uso casual em computadores pessoais, é uma preocupação séria ao lidar com documentos legais, informações médicas e dados comerciais sensíveis.

A pesquisa revelou que as taxas de alucinação variam amplamente entre as principais empresas de IA. A tecnologia da OpenAI tinha a taxa mais baixa, em torno de 3%, enquanto os sistemas da Meta, dona do Facebook e do Instagram, ficavam em torno de 5%. O sistema Claude 2 da Anthropic, uma rival da OpenAI, superou 8%. O sistema do Google, Palm Chat, teve a taxa mais alta, de 27%.

A pesquisa da Vectara mostrou que, ao resumir artigos de notícias, os chatbots não repetem informações falsas encontradas na internet, mas cometem erros ao resumir. As empresas estão trabalhando para melhorar a precisão de suas tecnologias, mas a alucinação dos chatbots continua sendo um desafio a ser superado, pois eles operam com base em probabilidades e padrões nos dados.

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 15:48

Bárbara Pereira

Jornalista com experiência em produção multimídia, acredito que as redes sociais são essenciais para alcançar novos públicos e disseminar informações em linguagem acessível e descontraída. Divido minha paixão por comunicação com livros, viagens e gastronomia.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024