Analisis tersebut mempertimbangkan skor setiap mata pelajaran dan menunjukkan bahwa kecerdasan buatan akan bekerja dengan baik di Enem, namun kinerjanya dalam matematika dianggap rendah, memperoleh rata-rata 443,1 poin, di bawah rata-rata kandidat manusia sebesar 527,1. Di sisi lain, ilmu-ilmu kemanusiaan, anehnya, diambil alih oleh teknologi. Dalam simulasi, rata-rata AI adalah 725,3, lebih tinggi dari pesaing sebenarnya sebesar 523,3 poin.
PUBLISITAS
Metodologi yang digunakan tes Enem dari lima tahun terakhir
Penilaian tersebut ChatGPT didasarkan pada tanggapan AI dari pengujian yang dilakukan selama lima tahun terakhir, menjawab 1.290 pertanyaan. Metodologi yang digunakan dalam tes ini adalah Item Response Theory. Model matematika yang diadopsi oleh Enem ini memprediksi item yang dikalibrasi berdasarkan parameter diskriminasi, kesulitan, dan kemungkinan serangan acak, seperti yang diriwayatkan oleh DeltaFolha.
A daun menghitung nilai akhir ChatGPT, menggunakan analisis standar Inep, di mana mesin hanya menjawab setiap pertanyaan satu kali, tanpa contoh sebelumnya, yang menunjukkan alternatif yang dianggap benar.
Meskipun ia unggul dalam ilmu pengetahuan manusia, bahasa, dan kode, namun ChatGPT menunjukkan kinerja matematika yang rendah, yang dapat menjadi hambatan untuk masuk ke mata kuliah populer di universitas-universitas federal utama di negara tersebut. Meski begitu, AI memperoleh nilai rata-rata 608,7 pada Enem, lebih baik dari nilai rata-rata yang diperoleh 79% siswa pada tahun itu, jika ditambahkan pada nilai esai.
PUBLISITAS
Baca juga: