ChatGPT anh ấy giỏi về nhân văn nhưng lại trượt về khoa học chính xác; hiểu bài kiểm tra được thực hiện với bài kiểm tra Enem

Theo một thử nghiệm được thực hiện bởi DeltaFolha, ChatGPTBởi vì OpenAI, anh ấy đã làm tốt bài kiểm tra Enem, chỉ trượt trong các bài kiểm tra chính xác. AI đạt điểm trung bình 612,3 trong các bài kiểm tra khách quan của Enem, vượt qua 98,9% sinh viên về khoa học con người và 95,3% về ngôn ngữ và mã.

Phân tích xem xét điểm của từng khóa học và cho thấy trí tuệ nhân tạo sẽ hoạt động tốt trong Enem, nhưng hiệu suất của nó trong môn toán được coi là thấp, đạt trung bình 443,1 điểm, thấp hơn mức trung bình 527,1 của các ứng viên con người. Mặt khác, thật kỳ lạ, các ngành khoa học nhân văn lại bị công nghệ chiếm lĩnh. Trong mô phỏng, điểm AI trung bình là 725,3, cao hơn mức 523,3 điểm của đối thủ thực.

QUẢNG CÁO

Đối với 70% người dân ở Hoa Kỳ, ChatGPT là đáng tin cậy, nghiên cứu cho thấy
Đối với 70% người dân ở Hoa Kỳ, ChatGPT là đáng tin cậy, nghiên cứu cho thấy

Phương pháp sử dụng xét nghiệm Enem trong 5 năm qua

Việc đánh giá của ChatGPT dựa trên phản hồi của AI từ các bài kiểm tra được thực hiện trong 1.290 năm qua, trả lời XNUMX câu hỏi. Phương pháp được sử dụng trong bài kiểm tra là Lý thuyết đáp ứng mục. Mô hình toán học này được Enem áp dụng dự đoán các vật phẩm được hiệu chỉnh theo các thông số phân biệt, độ khó và xác suất trúng đích ngẫu nhiên, như DeltaFolha thuật lại. 

A Tờ giấy đã tính điểm cuối kỳ ChatGPT, sử dụng phân tích tiêu chuẩn của Inep, trong đó máy chỉ trả lời mỗi câu hỏi một lần mà không có ví dụ trước đó, chỉ ra phương án thay thế mà nó cho là đúng.

Mặc dù ông rất xuất sắc trong các lĩnh vực khoa học nhân văn, ngôn ngữ và mật mã, nhưng ChatGPT trình bày thành tích toán học thấp, điều này có thể là trở ngại cho việc tham gia các khóa học phổ biến tại các trường đại học liên bang chính của đất nước. Mặc dù vậy, AI vẫn đạt được điểm trung bình là 608,7 trên Enem, cao hơn điểm mà 79% học sinh đạt được năm đó khi được cộng vào điểm bài luận.

QUẢNG CÁO

Đọc thêm:

Cuộn lên