ChatGPT той е добър в хуманитарните науки, но се подхлъзва в точните науки; разберете теста, извършен с изпита Enem

Според тест, извършен от DeltaFolha, ChatGPTЗащото OpenAI, той се справи добре с теста на Enem, като се подхлъзна само на точните изпити. AI получи среден резултат от 612,3 в обективните тестове на Enem, надминавайки 98,9% от студентите по хуманитарни науки и 95,3% по езици и кодове.

Анализът взе предвид резултата от всеки курс и показа, че изкуственият интелект би се представил добре в Enem, но представянето му по математика беше счетено за ниско, като получи средно 443,1 точки, под средната стойност от 527,1 за човешки кандидати. От друга страна, хуманитарните науки, любопитно, бяха взети от технологията. В симулацията средната стойност на AI беше 725,3, по-висока от 523,3 точки на реални конкуренти.

ПУБЛИЧНОСТ

За 70% от хората в Съединените щати, ChatGPT е надежден, показват изследванията
За 70% от хората в Съединените щати, ChatGPT е надежден, показват изследванията

Методологията използва тестове на Enem от последните пет години

Оценката на ChatGPT се основава на отговори на AI от тестове, взети през последните пет години, отговаряйки на 1.290 въпроса. Методологията, използвана в теста, беше теорията на отговора на въпроса. Този математически модел, възприет от Enem, предвижда елементи, калибрирани според параметрите на дискриминация, трудност и вероятност за случайно попадение, както е разказано от DeltaFolha. 

A Лист изчисли крайната оценка на ChatGPT, използвайки стандартния анализ на Inep, при който машината отговори на всеки въпрос само веднъж, без предишни примери, посочвайки алтернативата, която счита за правилна.

Въпреки че той превъзхождаше хуманитарните науки, езиците и кодовете, ChatGPT представиха ниски резултати по математика, което може да бъде пречка за влизане в популярни курсове в основните федерални университети в страната. Въпреки това AI получи среден резултат от 608,7 на Enem, по-добър от този, получен от 79% от учениците през същата година, когато се добави към оценката за есе.

ПУБЛИЧНОСТ

Прочетете също така:

превъртете нагоре