ChatGPT beşeri bilimlerde iyidir ama kesin bilimlerde kaymaktadır; Enem sınavı ile yapılan testi anlamak

DeltaFolha tarafından gerçekleştirilen bir teste göre, ChatGPTOf OpenAIEnem testinde iyi bir performans sergiledi, ancak kesin sınavlarda kaydı. Yapay zeka, Enem objektif testlerinde ortalama 612,3 puan alarak beşeri bilimlerde öğrencilerin %98,9'unu, diller ve kodlarda ise %95,3'ü geride bıraktı.

Analiz, her dersin puanını dikkate aldı ve yapay zekanın Enem'de iyi performans göstereceğini gösterdi ancak matematikteki performansının düşük olduğu değerlendirildi ve ortalama 443,1 puan alarak insan adaylarının 527,1 ortalamasının altında kaldı. Öte yandan, insan bilimleri ilginç bir şekilde teknoloji tarafından ele geçirildi. Simülasyonda yapay zeka ortalaması 725,3 olup, gerçek rakiplerin 523,3 puanından daha yüksekti.

YAYINLANDIRMA

Amerika Birleşik Devletleri'ndeki insanların %70'i için, ChatGPT Araştırmalar güvenilir olduğunu gösteriyor
Amerika Birleşik Devletleri'ndeki insanların %70'i için, ChatGPT Araştırmalar güvenilir olduğunu gösteriyor

Metodoloji son beş yılda Enem testlerini kullandı

Değerlendirmesi ChatGPT son beş yılda yapılan testlerden elde edilen 1.290 soruyu yanıtlayan yapay zeka yanıtlarına dayanıyordu. Testte kullanılan metodoloji Madde Tepki Teorisiydi. Enem'in benimsediği bu matematiksel model, DeltaFolha'nın anlattığı gibi, ayrım, zorluk ve rastgele vuruş olasılığı parametrelerine göre kalibre edilmiş öğeleri tahmin ediyor. 

A Folha final notunu hesapladım ChatGPT, Inep'in standart analizini kullanarak, makinenin her soruyu önceki örnekler olmadan yalnızca bir kez yanıtladığını ve doğru olduğunu düşündüğü alternatifi gösterdiğini söyledi.

Beşeri bilimlerde, dillerde ve kodlarda üstün olmasına rağmen, ChatGPT matematikte düşük performans gösterdi ve bu, ülkenin önde gelen federal üniversitelerindeki popüler derslere girişte engel teşkil edebilir. Buna rağmen yapay zeka, Enem sınavından ortalama 608,7 puan aldı; bu, makale notuna eklendiğinde o yıl öğrencilerin %79'unun elde ettiği puandan daha iyiydi.

YAYINLANDIRMA

Ayrıca okuyun:

yukarı kaydırmak