ChatGPT hän on hyvä humanistisissa tieteissä, mutta liukastuu eksaktissa tieteessä; ymmärtää Enem-kokeen kanssa suoritetun testin

DeltaFolhan tekemän testin mukaan ChatGPTKoska OpenAI, hän suoriutui hyvin Enem-testissä, vain liukastui tarkassa kokeessa. Tekoäly sai Enem-objektiivitesteissä keskimääräisen pistemäärän 612,3, mikä ohitti 98,9 % opiskelijoista humanististen tieteiden ja 95,3 % kielten ja koodien opiskelijoista.

Analyysi huomioi kunkin kurssin pisteet ja osoitti, että tekoäly pärjäisi hyvin Enemissä, mutta sen suorituskykyä matematiikassa pidettiin alhaisena, sillä se sai keskimäärin 443,1 pistettä, mikä on alle ihmisehdokkaiden 527,1 keskiarvon. Toisaalta humanistiset tieteet omituisesti otettiin tekniikan toimesta. Simulaatiossa tekoälyn keskiarvo oli 725,3, korkeampi kuin todellisten kilpailijoiden 523,3 pistettä.

MAINONTA

70 %:lle yhdysvaltalaisista ChatGPT on luotettava, tutkimukset osoittavat
70 %:lle yhdysvaltalaisista ChatGPT on luotettava, tutkimukset osoittavat

Metodologiassa käytettiin Enem-testejä viimeisen viiden vuoden ajalta

Arviointi ChatGPT perustui tekoälyvastauksiin viimeisten viiden vuoden aikana tehdyistä testeistä ja vastasi 1.290 XNUMX kysymykseen. Testissä käytetty metodologia oli Item Response Theory. Tämä Enemin käyttämä matemaattinen malli ennustaa kohteet, jotka on kalibroitu DeltaFolhan kertoman perusteella, erottelun, vaikeuden ja satunnaisen osuman todennäköisyyden parametrien mukaan. 

A arkki laskenut lopullisen arvosanan ChatGPT, käyttäen Inepin standardianalyysiä, jossa kone vastasi jokaiseen kysymykseen vain kerran, ilman aikaisempia esimerkkejä ja osoitti oikeana pitämänsä vaihtoehdon.

Vaikka hän oli erinomainen humanistisissa tieteissä, kielissä ja koodeissa, ChatGPT esitti heikon suorituskyvyn matematiikassa, mikä voisi olla este pääsylle suosituille kursseille maan tärkeimmissä liittovaltion yliopistoissa. Siitä huolimatta tekoäly sai Enemistä keskimääräisen pistemäärän 608,7, mikä on parempi kuin 79 % opiskelijoista samana vuonna, kun se lisättiin esseen arvosanaan.

MAINONTA

Lue myös:

Selaa ylöspäin