ChatGPT dia bagus dalam kemanusiaan tetapi tergelincir dalam sains tepat; memahami ujian yang dijalankan dengan peperiksaan Enem

Menurut ujian yang dijalankan oleh DeltaFolha, yang ChatGPTKerana OpenAI, dia berjaya dalam ujian Enem, hanya tergelincir dalam peperiksaan yang tepat. AI memperoleh skor purata 612,3 dalam ujian objektif Enem, melepasi 98,9% pelajar dalam sains manusia dan 95,3% dalam bahasa dan kod.

Analisis mempertimbangkan skor setiap kursus dan menunjukkan bahawa kecerdasan buatan akan berprestasi baik dalam Enem, tetapi prestasinya dalam matematik dianggap rendah, memperoleh purata 443,1 mata, di bawah purata 527,1 calon manusia. Sebaliknya, sains manusia, secara ingin tahu, diambil oleh teknologi. Dalam simulasi, purata AI ialah 725,3, lebih tinggi daripada 523,3 mata pesaing sebenar.

PUBLISITI

Bagi 70% orang di Amerika Syarikat, ChatGPT boleh dipercayai, kajian menunjukkan
Bagi 70% orang di Amerika Syarikat, ChatGPT boleh dipercayai, kajian menunjukkan

Metodologi menggunakan ujian Enem dari lima tahun yang lalu

Penilaian terhadap ChatGPT adalah berdasarkan respons AI daripada ujian yang diambil dalam tempoh lima tahun yang lalu, menjawab 1.290 soalan. Metodologi yang digunakan dalam ujian ialah Teori Tindak Balas Item. Model matematik yang diguna pakai oleh Enem ini meramalkan item yang ditentukur mengikut parameter diskriminasi, kesukaran dan kebarangkalian pukulan rawak, seperti yang diceritakan oleh DeltaFolha. 

A Lembaran mengira gred akhir ChatGPT, menggunakan analisis standard Inep, di mana mesin menjawab setiap soalan sekali sahaja, tanpa contoh sebelumnya, menunjukkan alternatif yang dianggap betul.

Walaupun dia cemerlang dalam sains manusia dan bahasa dan kod, the ChatGPT mempersembahkan prestasi rendah dalam matematik, yang boleh menjadi penghalang untuk memasuki kursus popular di universiti persekutuan utama negara. Walaupun begitu, AI memperoleh purata skor 608,7 pada Enem, lebih baik daripada yang diperoleh oleh 79% pelajar pada tahun itu, apabila ditambah kepada gred esei.

PUBLISITI

Baca juga:

Tatal ke atas