ChatGPT hän on hyvä humanistisissa tieteissä, mutta liukastuu eksaktissa tieteessä; ymmärtää Enem-kokeen kanssa suoritetun testin

Analyysi huomioi kunkin kurssin pisteet ja osoitti, että tekoäly pärjäisi hyvin Enemissä, mutta sen suorituskykyä matematiikassa pidettiin alhaisena, sillä se sai keskimäärin 443,1 pistettä, mikä on alle ihmisehdokkaiden 527,1 keskiarvon. Toisaalta humanistiset tieteet omituisesti otettiin tekniikan toimesta. Simulaatiossa tekoälyn keskiarvo oli 725,3, korkeampi kuin todellisten kilpailijoiden 523,3 pistettä.

MAINONTA

70 %:lle yhdysvaltalaisista ChatGPT on luotettava, tutkimukset osoittavat

Metodologiassa käytettiin Enem-testejä viimeisen viiden vuoden ajalta

Arviointi ChatGPT perustui tekoälyvastauksiin viimeisten viiden vuoden aikana tehdyistä testeistä ja vastasi 1.290 XNUMX kysymykseen. Testissä käytetty metodologia oli Item Response Theory. Tämä Enemin käyttämä matemaattinen malli ennustaa kohteet, jotka on kalibroitu DeltaFolhan kertoman perusteella, erottelun, vaikeuden ja satunnaisen osuman todennäköisyyden parametrien mukaan.

A arkki laskenut lopullisen arvosanan ChatGPT, käyttäen Inepin standardianalyysiä, jossa kone vastasi jokaiseen kysymykseen vain kerran, ilman aikaisempia esimerkkejä ja osoitti oikeana pitämänsä vaihtoehdon.

ChatGPT on parempi kuin 80 % Enemin opiskelijoista, mutta matematiikassa lipsahtaa https://t.co/RcQbhmFC91
- Folha de S.Paulo (@folha) Huhtikuu 5, 2023

Vaikka hän oli erinomainen humanistisissa tieteissä, kielissä ja koodeissa, ChatGPT esitti heikon suorituskyvyn matematiikassa, mikä voisi olla este pääsylle suosituille kursseille maan tärkeimmissä liittovaltion yliopistoissa. Siitä huolimatta tekoäly sai Enemistä keskimääräisen pistemäärän 608,7, mikä on parempi kuin 79 % opiskelijoista samana vuonna, kun se lisättiin esseen arvosanaan.

MAINONTA

Lue myös:

Bill Gates questionkirje, joka pyytää taukoa tekoälyn kehityksessä