ChatGPT é bom em humanas mas desliza nas exatas; entenda o teste feito com prova do Enem

De acordo com um teste realizado pelo DeltaFolha, o ChatGPT, da OpenAI, se deu bem na prova do Enem, derrapando apenas nas exatas. A IA obteve uma pontuação média de 612,3 nas provas objetivas do Enem, superando 98,9% dos estudantes em ciências humanas e 95,3% em linguagens e códigos.

Publicado por
Uesley Durães

A análise considerou a pontuação de cada curso e mostrou que a inteligência artificial teria um bom desempenho no Enem, porém seu desempenho em matemática foi considerado baixo, obtendo uma média de 443,1 pontos, abaixo dos 527,1 de média dos candidatos humanos. Em contrapartida, as ciências humanas, curiosamente, foram tiradas de letra pela tecnologia. Na simulação, a média da IA foi de 725,3, superior à de 523,3 pontos dos concorrentes reais.

Para 70% das pessoas nos Estados Unidos o ChatGPT é confiável, aponta pesquisa

Metodologia usou provas do Enem dos últimos cinco anos

A avaliação do ChatGPT foi baseada em respostas da IA em provas realizadas nos últimos cinco anos, respondendo a 1.290 questões. A metodologia usada no teste foi a Teoria de Resposta ao Item. Esse modelo matemático adotado pelo Enem prevê itens calibrados conforme parâmetros de discriminação, dificuldade e probabilidade de acerto casual, como narrado pela DeltaFolha. 

A Folha calculou a nota final do ChatGPT, utilizando a análise padrão do Inep, em que a máquina respondeu a cada pergunta apenas uma vez, sem exemplos prévios, indicando a alternativa que julgava correta.

Embora tenha se destacado em ciências humanas e linguagens e códigos, o ChatGPT apresentou baixo desempenho em matemática, o que pode ser um obstáculo para o ingresso em cursos disputados das principais universidades federais do país. Mesmo assim, a IA obteve uma nota média de 608,7 no Enem, melhor do que a obtida por 79% dos alunos naquele ano, quando somada à nota da redação.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 11:51

Uesley Durães

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024