ChatGPT anh ấy giỏi về nhân văn nhưng lại trượt về khoa học chính xác; hiểu bài kiểm tra được thực hiện với bài kiểm tra Enem

Phân tích xem xét điểm của từng khóa học và cho thấy trí tuệ nhân tạo sẽ hoạt động tốt trong Enem, nhưng hiệu suất của nó trong môn toán được coi là thấp, đạt trung bình 443,1 điểm, thấp hơn mức trung bình 527,1 của các ứng viên con người. Mặt khác, thật kỳ lạ, các ngành khoa học nhân văn lại bị công nghệ chiếm lĩnh. Trong mô phỏng, điểm AI trung bình là 725,3, cao hơn mức 523,3 điểm của đối thủ thực.

QUẢNG CÁO

Đối với 70% người dân ở Hoa Kỳ, ChatGPT là đáng tin cậy, nghiên cứu cho thấy

Phương pháp sử dụng xét nghiệm Enem trong 5 năm qua

Việc đánh giá của ChatGPT dựa trên phản hồi của AI từ các bài kiểm tra được thực hiện trong 1.290 năm qua, trả lời XNUMX câu hỏi. Phương pháp được sử dụng trong bài kiểm tra là Lý thuyết đáp ứng mục. Mô hình toán học này được Enem áp dụng dự đoán các vật phẩm được hiệu chỉnh theo các thông số phân biệt, độ khó và xác suất trúng đích ngẫu nhiên, như DeltaFolha thuật lại.

A Tờ giấy đã tính điểm cuối kỳ ChatGPT, sử dụng phân tích tiêu chuẩn của Inep, trong đó máy chỉ trả lời mỗi câu hỏi một lần mà không có ví dụ trước đó, chỉ ra phương án thay thế mà nó cho là đúng.

ChatGPT giỏi hơn 80% học sinh Enem nhưng lại trượt môn toán https://t.co/RcQbhmFC91
- Folha de S.Paulo (@folha) 5 Tháng Tư, 2023

Mặc dù ông rất xuất sắc trong các lĩnh vực khoa học nhân văn, ngôn ngữ và mật mã, nhưng ChatGPT trình bày thành tích toán học thấp, điều này có thể là trở ngại cho việc tham gia các khóa học phổ biến tại các trường đại học liên bang chính của đất nước. Mặc dù vậy, AI vẫn đạt được điểm trung bình là 608,7 trên Enem, cao hơn điểm mà 79% học sinh đạt được năm đó khi được cộng vào điểm bài luận.

QUẢNG CÁO

Đọc thêm:

Bill Gates questionbức thư yêu cầu tạm dừng phát triển trí tuệ nhân tạo