ChatGPT a bölcsészettudományokban jó, de az egzakt tudományokban csúszik; megérteni az Enem vizsgával végzett tesztet

Az elemzés figyelembe vette az egyes kurzusok pontszámait, és azt mutatta, hogy a mesterséges intelligencia jól teljesít az Enemben, azonban matematikai teljesítményét alacsonynak ítélték, átlagosan 443,1 pontot ért el, ami alatta marad a humán jelöltek 527,1-es átlagának. Másrészt a humán tudományokat furcsa módon a technológia vette át. A szimulációban az AI-átlag 725,3 volt, ami magasabb, mint a valódi versenyzők 523,3 pontja.

HIRDETŐ

Az Egyesült Államokban élők 70%-ának ChatGPT megbízható, mutatják a kutatások

A módszertan az elmúlt öt év Enem tesztjeit használta

Az értékelés a ChatGPT az elmúlt öt évben végzett tesztek mesterséges intelligencia válaszain alapult, és 1.290 kérdésre válaszolt. A tesztben az item-válasz elméletet használtuk. Ez az Enem által elfogadott matematikai modell a megkülönböztetés, a nehézség és a véletlenszerű találatok valószínűségének paraméterei szerint kalibrált tételeket jósol meg, amint azt DeltaFolha meséli el.

A lap kiszámította a végső osztályzatot ChatGPT, az Inep standard elemzésével, amelyben a gép minden kérdésre csak egyszer válaszolt, korábbi példák nélkül, jelezve az általa helyesnek ítélt alternatívát.

ChatGPT jobb, mint a tanulók 80%-a Enemben, de csúszik a matematika https://t.co/RcQbhmFC91
— Folha de S.Paulo (@folha) April 5, 2023

Bár a humán tudományokban és a nyelvekben és kódokban jeleskedett, a ChatGPT alacsony matematikai teljesítményt mutatott be, ami akadálya lehet az ország fő szövetségi egyetemein népszerű kurzusokra való belépésnek. Ennek ellenére a mesterséges intelligencia 608,7-es átlagos pontszámot ért el az Enem-en, ami jobb annál, mint amit abban az évben a tanulók 79%-a kapott, ha hozzáadtuk a dolgozat osztályzatához.

HIRDETŐ

Olvassa el:

Bill Gates questiona levél, amely szünetet kér a mesterséges intelligencia fejlesztésében