ChatGPT han er god i humaniora, men glir inn eksakte vitenskaper; forstå testen utført med Enem-eksamenen

Analysen vurderte poengsummen for hvert kurs og viste at kunstig intelligens ville prestere godt i Enem, men ytelsen i matematikk ble ansett som lav, og oppnådde et gjennomsnitt på 443,1 poeng, under gjennomsnittet på 527,1 for menneskelige kandidater. På den annen side ble humanvitenskapene, merkelig nok, tatt av teknologi. I simuleringen var AI-gjennomsnittet 725,3, høyere enn 523,3 poeng til virkelige konkurrenter.

REKLAME

For 70 % av befolkningen i USA, ChatGPT er pålitelig, viser forskning

Metodikk brukt Enem-tester fra de siste fem årene

Vurderingen av ChatGPT var basert på AI-svar fra tester tatt de siste fem årene, og svarte på 1.290 spørsmål. Metodikken som ble brukt i testen var Item Response Theory. Denne matematiske modellen adoptert av Enem forutsier elementer kalibrert i henhold til parametere for diskriminering, vanskelighetsgrad og sannsynlighet for et tilfeldig treff, som fortalt av DeltaFolha.

A blad beregnet den endelige karakteren på ChatGPT, ved å bruke Ineps standardanalyse, der maskinen svarte på hvert spørsmål bare én gang, uten tidligere eksempler, og indikerte alternativet den anså som riktig.

ChatGPT er bedre enn 80 % av elevene i Enem, men glir i matematikk https://t.co/RcQbhmFC91
— Folha de S.Paulo (@folha) April 5, 2023

Selv om han utmerket seg innen humanvitenskap og språk og koder, ChatGPT presenterte lave prestasjoner i matematikk, noe som kan være en hindring for å komme inn på populære kurs ved landets viktigste føderale universiteter. Likevel oppnådde AI en gjennomsnittlig poengsum på 608,7 på Enem, bedre enn den oppnådd av 79% av studentene det året, når det ble lagt til essaykarakteren.

REKLAME

Les også:

Bill Gates questionbrevet som ber om en pause i utviklingen av kunstig intelligens