ChatGPT a bölcsészettudományokban jó, de az egzakt tudományokban csúszik; megérteni az Enem vizsgával végzett tesztet

A DeltaFolha által végzett teszt szerint a ChatGPTMert OpenAI, jól teljesített az Enem teszten, csak a pontos vizsgákon csúszott. A mesterséges intelligencia 612,3-as átlagos pontszámot ért el az Enem objektív teszteken, ami a humán tudományok terén a hallgatók 98,9%-át, a nyelvek és kódok terén pedig 95,3%-át felülmúlta.

Az elemzés figyelembe vette az egyes kurzusok pontszámait, és azt mutatta, hogy a mesterséges intelligencia jól teljesít az Enemben, azonban matematikai teljesítményét alacsonynak ítélték, átlagosan 443,1 pontot ért el, ami alatta marad a humán jelöltek 527,1-es átlagának. Másrészt a humán tudományokat furcsa módon a technológia vette át. A szimulációban az AI-átlag 725,3 volt, ami magasabb, mint a valódi versenyzők 523,3 pontja.

HIRDETŐ

Az Egyesült Államokban élők 70%-ának ChatGPT megbízható, mutatják a kutatások
Az Egyesült Államokban élők 70%-ának ChatGPT megbízható, mutatják a kutatások

A módszertan az elmúlt öt év Enem tesztjeit használta

Az értékelés a ChatGPT az elmúlt öt évben végzett tesztek mesterséges intelligencia válaszain alapult, és 1.290 kérdésre válaszolt. A tesztben az item-válasz elméletet használtuk. Ez az Enem által elfogadott matematikai modell a megkülönböztetés, a nehézség és a véletlenszerű találatok valószínűségének paraméterei szerint kalibrált tételeket jósol meg, amint azt DeltaFolha meséli el. 

A lap kiszámította a végső osztályzatot ChatGPT, az Inep standard elemzésével, amelyben a gép minden kérdésre csak egyszer válaszolt, korábbi példák nélkül, jelezve az általa helyesnek ítélt alternatívát.

Bár a humán tudományokban és a nyelvekben és kódokban jeleskedett, a ChatGPT alacsony matematikai teljesítményt mutatott be, ami akadálya lehet az ország fő szövetségi egyetemein népszerű kurzusokra való belépésnek. Ennek ellenére a mesterséges intelligencia 608,7-es átlagos pontszámot ért el az Enem-en, ami jobb annál, mint amit abban az évben a tanulók 79%-a kapott, ha hozzáadtuk a dolgozat osztályzatához.

HIRDETŐ

Olvassa el:

görgess fel