ChatGPT han er god i humaniora, men glir inn eksakte vitenskaper; forstå testen utført med Enem-eksamenen

I følge en test utført av DeltaFolha ChatGPTFordi OpenAI, gjorde han det bra på Enem-testen, og sklir bare i de eksakte eksamenene. AI oppnådde en gjennomsnittlig poengsum på 612,3 i Enem-målprøvene, og overgikk 98,9% av studentene i humanvitenskap og 95,3% i språk og koder.

Analysen vurderte poengsummen for hvert kurs og viste at kunstig intelligens ville prestere godt i Enem, men ytelsen i matematikk ble ansett som lav, og oppnådde et gjennomsnitt på 443,1 poeng, under gjennomsnittet på 527,1 for menneskelige kandidater. På den annen side ble humanvitenskapene, merkelig nok, tatt av teknologi. I simuleringen var AI-gjennomsnittet 725,3, høyere enn 523,3 poeng til virkelige konkurrenter.

REKLAME

For 70 % av befolkningen i USA, ChatGPT er pålitelig, viser forskning
For 70 % av befolkningen i USA, ChatGPT er pålitelig, viser forskning

Metodikk brukt Enem-tester fra de siste fem årene

Vurderingen av ChatGPT var basert på AI-svar fra tester tatt de siste fem årene, og svarte på 1.290 spørsmål. Metodikken som ble brukt i testen var Item Response Theory. Denne matematiske modellen adoptert av Enem forutsier elementer kalibrert i henhold til parametere for diskriminering, vanskelighetsgrad og sannsynlighet for et tilfeldig treff, som fortalt av DeltaFolha. 

A blad beregnet den endelige karakteren på ChatGPT, ved å bruke Ineps standardanalyse, der maskinen svarte på hvert spørsmål bare én gang, uten tidligere eksempler, og indikerte alternativet den anså som riktig.

Selv om han utmerket seg innen humanvitenskap og språk og koder, ChatGPT presenterte lave prestasjoner i matematikk, noe som kan være en hindring for å komme inn på populære kurs ved landets viktigste føderale universiteter. Likevel oppnådde AI en gjennomsnittlig poengsum på 608,7 på Enem, bedre enn den oppnådd av 79% av studentene det året, når det ble lagt til essaykarakteren.

REKLAME

Les også:

bla opp