Durante um estudo realizado na Universidade da Califórnia, nos Estados Unidos, um chatbot criado na década de 1960 demonstrou superioridade sobre o ChatGPT no Teste de Turing. Esse experimento busca medir a habilidade de uma inteligência artificial (IA) em se passar por um ser humano.
Na pesquisa realizada na universidade, foi conduzido um teste entre o chatbot ELIZA, criado na década de 1960 por Joseph Weizenbaum do MIT, e o ChatGPT, impulsionado pela versão gratuita GPT-3.5 da IA. O Teste de Turing busca avaliar a capacidade de uma máquina em imitar a comunicação humana, sem considerar a “consciência” da IA, apenas sua habilidade em replicar interações humanas.
Alan Turing, cientista da computação, desenvolveu essa avaliação em 1950, envolvendo três participantes: dois humanos e a máquina testada. Um dos indivíduos assume o papel de interrogador, fazendo perguntas aos outros dois participantes sem saber quem é humano e quem é a máquina.
Na pesquisa conduzida pela Universidade da Califórnia, 652 participantes humanos foram envolvidos para avaliar as interações dos chatbots. O ELIZA conseguiu se passar por humano em aproximadamente 27% dos casos, enquanto o GPT-3.5 alcançou apenas 14%.
Os avaliadores tomaram sua decisão considerando o estilo linguístico e traços socioemocionais das máquinas.
Embora o ELIZA tenha superado o GPT-3.5, o mesmo não pode ser dito em relação ao GPT-4. Este chatbot da OpenAI, mesmo sendo pago, foi mais convincente, conseguindo enganar os participantes do teste em cerca de 41% das interações.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 12:12
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…