ChatGPT dia pandai dalam bidang humaniora tetapi gagal dalam ilmu eksakta; memahami tes yang dilakukan dengan ujian Enem

Analisis tersebut mempertimbangkan skor setiap mata pelajaran dan menunjukkan bahwa kecerdasan buatan akan bekerja dengan baik di Enem, namun kinerjanya dalam matematika dianggap rendah, memperoleh rata-rata 443,1 poin, di bawah rata-rata kandidat manusia sebesar 527,1. Di sisi lain, ilmu-ilmu kemanusiaan, anehnya, diambil alih oleh teknologi. Dalam simulasi, rata-rata AI adalah 725,3, lebih tinggi dari pesaing sebenarnya sebesar 523,3 poin.

PUBLISITAS

Bagi 70% orang di Amerika Serikat, ChatGPT dapat diandalkan, menurut penelitian

Metodologi yang digunakan tes Enem dari lima tahun terakhir

Penilaian tersebut ChatGPT didasarkan pada tanggapan AI dari pengujian yang dilakukan selama lima tahun terakhir, menjawab 1.290 pertanyaan. Metodologi yang digunakan dalam tes ini adalah Item Response Theory. Model matematika yang diadopsi oleh Enem ini memprediksi item yang dikalibrasi berdasarkan parameter diskriminasi, kesulitan, dan kemungkinan serangan acak, seperti yang diriwayatkan oleh DeltaFolha.

A daun menghitung nilai akhir ChatGPT, menggunakan analisis standar Inep, di mana mesin hanya menjawab setiap pertanyaan satu kali, tanpa contoh sebelumnya, yang menunjukkan alternatif yang dianggap benar.

ChatGPT lebih baik dari 80% siswa di Enem, tetapi tergelincir dalam matematika https://t.co/RcQbhmFC91
— Folha de S.Paulo (@folha) 5 April, 2023

Meskipun ia unggul dalam ilmu pengetahuan manusia, bahasa, dan kode, namun ChatGPT menunjukkan kinerja matematika yang rendah, yang dapat menjadi hambatan untuk masuk ke mata kuliah populer di universitas-universitas federal utama di negara tersebut. Meski begitu, AI memperoleh nilai rata-rata 608,7 pada Enem, lebih baik dari nilai rata-rata yang diperoleh 79% siswa pada tahun itu, jika ditambahkan pada nilai esai.

PUBLISITAS

Baca juga:

Bill Gates questionsurat yang meminta jeda dalam pengembangan kecerdasan buatan