การวิเคราะห์พิจารณาคะแนนของแต่ละหลักสูตรและแสดงให้เห็นว่าปัญญาประดิษฐ์จะทำงานได้ดีใน Enem แต่ประสิทธิภาพในวิชาคณิตศาสตร์ถือว่าต่ำ โดยได้คะแนนเฉลี่ย 443,1 คะแนน ซึ่งต่ำกว่าค่าเฉลี่ยของผู้สมัครที่เป็นมนุษย์ซึ่งได้ 527,1 คะแนน ในทางกลับกัน วิทยาศาสตร์ของมนุษย์ได้รับความสนใจจากเทคโนโลยีอย่างน่าสงสัย ในการจำลองค่าเฉลี่ย AI อยู่ที่ 725,3 ซึ่งสูงกว่าคู่แข่งจริงที่ได้ 523,3 คะแนน
การเผยแพร่
ระเบียบวิธีใช้การทดสอบ Enem จากห้าปีที่ผ่านมา
การประเมินผลของ ChatGPT อิงตามการตอบสนองของ AI จากการทดสอบในช่วงห้าปีที่ผ่านมา โดยตอบคำถาม 1.290 ข้อ วิธีทดสอบที่ใช้ในการทดสอบคือ ทฤษฎีการตอบสนองตามข้อ แบบจำลองทางคณิตศาสตร์ที่ Enem นำมาใช้ทำนายรายการที่ปรับเทียบตามพารามิเตอร์ของการเลือกปฏิบัติ ความยาก และความน่าจะเป็นของการโจมตีแบบสุ่ม ตามที่บรรยายโดย DeltaFolha
A ฟอลฮา คำนวณเกรดสุดท้ายของ ChatGPTโดยใช้การวิเคราะห์มาตรฐานของ Inep ซึ่งเครื่องตอบคำถามแต่ละข้อเพียงครั้งเดียว โดยไม่มีตัวอย่างก่อนหน้านี้ ซึ่งระบุทางเลือกอื่นที่ถือว่าถูกต้อง
แม้ว่าเขาจะเก่งในด้านวิทยาศาสตร์มนุษย์ ภาษา และรหัสก็ตาม ChatGPT มีผลการเรียนคณิตศาสตร์ต่ำ ซึ่งอาจเป็นอุปสรรคต่อการเข้าเรียนหลักสูตรยอดนิยมที่มหาวิทยาลัยของรัฐบาลกลางหลักๆ ของประเทศ ถึงกระนั้น AI ก็ได้รับคะแนนเฉลี่ย 608,7 ใน Enem ซึ่งดีกว่าคะแนนที่ได้รับโดยนักเรียน 79% ในปีนั้น เมื่อบวกเข้ากับเกรดเรียงความ
การเผยแพร่
อ่านเพิ่มเติม: