ChatGPT он је добар у хуманистичким наукама, али лапса у егзактним наукама; разумеју тест обављен са Енем испитом

Према тесту који је спровео ДелтаФолха, ChatGPTоф тхе OpenAI, добро је прошао на тесту Енем, само је оклизнуо на егзактним испитима. АИ је добио просечну оцену од 612,3 на Енем објективним тестовима, надмашивши 98,9% студената у хуманистичким наукама и 95,3% у језицима и кодовима.

Анализа је разматрала резултат сваког курса и показала да би се вештачка интелигенција добро показала у Енем-у, међутим њен учинак у математици се сматрао ниским, добијајући у просеку 443,1 поен, испод просека од 527,1 људских кандидата. С друге стране, хумане науке, зачудо, преузела је технологија. У симулацији, АИ просек је био 725,3, што је више од 523,3 поена правих конкурената.

ОГЛАШАВАЊЕ

За 70% људи у Сједињеним Државама, ChatGPT је поуздан, показују истраживања
За 70% људи у Сједињеним Државама, ChatGPT је поуздан, показују истраживања

Методологија је користила Енем тестове из последњих пет година

Оцена о ChatGPT је заснован на одговорима вештачке интелигенције са тестова спроведених у последњих пет година, дајући одговоре на 1.290 питања. Методологија која је коришћена у тесту била је Теорија одговора на предмет. Овај математички модел који је усвојио Енем предвиђа ставке калибрисане према параметрима дискриминације, тежине и вероватноће случајног поготка, како наводи ДелтаФолха. 

A Лист израчунао коначну оцену ChatGPT, користећи Инепову стандардну анализу, у којој је машина на свако питање одговорила само једном, без претходних примера, указујући на алтернативу коју сматра исправном.

Иако се истакао у људским наукама и језицима и кодовима, ChatGPT представио низак учинак у математици, што би могло бити препрека за упис на популарне курсеве на главним савезним универзитетима у земљи. Упркос томе, АИ је добио просечну оцену од 608,7 на Енем-у, бољу од оне коју је те године добило 79% ученика, када се дода оцени за есеј.

ОГЛАШАВАЊЕ

Прочитајте још:

Померање нагоре