ChatGPT je dobrý v humanitních vědách, ale sklouzává v exaktních vědách; porozumět testu provedenému se zkouškou Enem

Analýza vzala v úvahu skóre každého kurzu a ukázala, že umělá inteligence by si v Enem vedla dobře, nicméně její výkon v matematice byl považován za nízký, přičemž průměrně dosáhl 443,1 bodů, což je méně než průměr 527,1 lidských kandidátů. Na druhou stranu, humanitní vědy, kupodivu, převzala technologie. V simulaci byl průměr AI 725,3, což je více než 523,3 bodů skutečných konkurentů.

PUBLICITA

Pro 70 % lidí ve Spojených státech ChatGPT je spolehlivý, ukazují výzkumy

Metodika použitá Enem testy z posledních pěti let

Hodnocení ChatGPT byla založena na odpovědích umělé inteligence z testů provedených za posledních pět let a odpovídala na 1.290 otázek. Metodika použitá v testu byla teorie odezvy na položku. Tento matematický model přijatý Enemem předpovídá položky kalibrované podle parametrů diskriminace, obtížnosti a pravděpodobnosti náhodného zásahu, jak je vyprávěl DeltaFolha.

A Prostěradlo vypočítal konečnou známku ChatGPTpomocí standardní analýzy Inep, ve které stroj odpověděl na každou otázku pouze jednou, bez předchozích příkladů, s uvedením alternativy, kterou považoval za správnou.

ChatGPT je lepší než 80 % studentů v Enem, ale skluzy v matematice https://t.co/RcQbhmFC91
— Folha de S. Paulo (@folha) 5. dubna 2023

Ačkoli vynikal v humanitních vědách a jazycích a kódech, ChatGPT prezentovali nízkou výkonnost v matematice, která by mohla být překážkou pro vstup do populárních kurzů na hlavních federálních univerzitách v zemi. I tak dosáhla AI průměrného skóre 608,7 na Enem, což je lepší než to, které v daném roce získalo 79 % studentů, když se přidali ke známce za esej.

PUBLICITA

Čtěte také:

Bill Gates questiondopis, který žádá o pauzu ve vývoji umělé inteligence