ChatGPT é bom em humanas mas desliza nas exatas; entenda o teste feito com prova do Enem

De acordo com um teste realizado pelo DeltaFolha, o ChatGPT, da OpenAI, se deu bem na prova do Enem, derrapando apenas nas exatas. A IA obteve uma pontuação média de 612,3 nas provas objetivas do Enem, superando 98,9% dos estudantes em ciências humanas e 95,3% em linguagens e códigos.

Publicado por
Uesley Durães

A análise considerou a pontuação de cada curso e mostrou que a inteligência artificial teria um bom desempenho no Enem, porém seu desempenho em matemática foi considerado baixo, obtendo uma média de 443,1 pontos, abaixo dos 527,1 de média dos candidatos humanos. Em contrapartida, as ciências humanas, curiosamente, foram tiradas de letra pela tecnologia. Na simulação, a média da IA foi de 725,3, superior à de 523,3 pontos dos concorrentes reais.

Para 70% das pessoas nos Estados Unidos o ChatGPT é confiável, aponta pesquisa

Metodologia usou provas do Enem dos últimos cinco anos

A avaliação do ChatGPT foi baseada em respostas da IA em provas realizadas nos últimos cinco anos, respondendo a 1.290 questões. A metodologia usada no teste foi a Teoria de Resposta ao Item. Esse modelo matemático adotado pelo Enem prevê itens calibrados conforme parâmetros de discriminação, dificuldade e probabilidade de acerto casual, como narrado pela DeltaFolha. 

A Folha calculou a nota final do ChatGPT, utilizando a análise padrão do Inep, em que a máquina respondeu a cada pergunta apenas uma vez, sem exemplos prévios, indicando a alternativa que julgava correta.

Embora tenha se destacado em ciências humanas e linguagens e códigos, o ChatGPT apresentou baixo desempenho em matemática, o que pode ser um obstáculo para o ingresso em cursos disputados das principais universidades federais do país. Mesmo assim, a IA obteve uma nota média de 608,7 no Enem, melhor do que a obtida por 79% dos alunos naquele ano, quando somada à nota da redação.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 11:51

Uesley Durães

Posts recentes

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024

Robôs da Figure transformam produção da BMW; saiba como

Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…

20 de novembro de 2024

Microsoft revela agentes de IA especializados e ferramentas de automação

A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…

20 de novembro de 2024