ChatGPT je dobrý v humanitních vědách, ale sklouzává v exaktních vědách; porozumět testu provedenému se zkouškou Enem

Podle testu provedeného společností DeltaFolha ChatGPTProtože OpenAI, v testu Enem si vedl dobře, jen u přesných zkoušek uklouzl. AI získala průměrné skóre 612,3 v cílových testech Enem, čímž překonala 98,9 % studentů v humanitních vědách a 95,3 % v jazycích a kódech.

Analýza vzala v úvahu skóre každého kurzu a ukázala, že umělá inteligence by si v Enem vedla dobře, nicméně její výkon v matematice byl považován za nízký, přičemž průměrně dosáhl 443,1 bodů, což je méně než průměr 527,1 lidských kandidátů. Na druhou stranu, humanitní vědy, kupodivu, převzala technologie. V simulaci byl průměr AI 725,3, což je více než 523,3 bodů skutečných konkurentů.

PUBLICITA

Pro 70 % lidí ve Spojených státech ChatGPT je spolehlivý, ukazují výzkumy
Pro 70 % lidí ve Spojených státech ChatGPT je spolehlivý, ukazují výzkumy

Metodika použitá Enem testy z posledních pěti let

Hodnocení ChatGPT byla založena na odpovědích umělé inteligence z testů provedených za posledních pět let a odpovídala na 1.290 otázek. Metodika použitá v testu byla teorie odezvy na položku. Tento matematický model přijatý Enemem předpovídá položky kalibrované podle parametrů diskriminace, obtížnosti a pravděpodobnosti náhodného zásahu, jak je vyprávěl DeltaFolha. 

A Prostěradlo vypočítal konečnou známku ChatGPTpomocí standardní analýzy Inep, ve které stroj odpověděl na každou otázku pouze jednou, bez předchozích příkladů, s uvedením alternativy, kterou považoval za správnou.

Ačkoli vynikal v humanitních vědách a jazycích a kódech, ChatGPT prezentovali nízkou výkonnost v matematice, která by mohla být překážkou pro vstup do populárních kurzů na hlavních federálních univerzitách v zemi. I tak dosáhla AI průměrného skóre 608,7 na Enem, což je lepší než to, které v daném roce získalo 79 % studentů, když se přidali ke známce za esej.

PUBLICITA

Čtěte také:

posunout nahoru