ChatGPT 他擅長人文學科,但在精確科學方面卻表現不佳。了解 Enem 考試進行的測試

根據 DeltaFolha 進行的測試, ChatGPT從 OpenAI,他在 Enem 測試中表現出色,只是在精確考試中滑落了。 AI在Enem客觀測驗中獲得了612,3的平均分,超過了人文科學專業98,9%的學生以及語言和代碼專業95,3%的學生。

分析考慮了每門課程的分數,結果顯示人工智慧在 Enem 中表現良好,但其在數學方面的表現被認為較低,平均得分為 443,1 分,低於人類考生的平均分數 527,1 分。另一方面,令人好奇的是,人文科學卻被科技取代。模擬中,AI平均分為725,3,高於真實選手的523,3分。

宣傳

對於 70% 的美國人來說, ChatGPT 根據研究,這是值得信賴的
對於 70% 的美國人來說, ChatGPT 根據研究,這是值得信賴的

方法使用過去五年的 Enem 測試

的評估 ChatGPT 基於過去 1.290 年測試中人工智慧的回答,回答了 XNUMX 個問題。測驗中使用的方法是項目反應理論。正如 DeltaFolha 所敘述的那樣,Enem 採用的這種數學模型根據隨機命中的辨別力、難度和機率參數來預測項目。 

A Folha 計算出最終成績 ChatGPT,使用 Inep 的標準分析,其中機器僅回答每個問題一次,沒有先前的範例,表明它認為正確的替代方案。

儘管他在人文科學以及語言和代碼方面表現出色, ChatGPT 數學成績不佳,這可能成為進入該國主要聯邦大學熱門課程的障礙。即便如此,AI 在 Enem 上的平均成績為 608,7,高於當年 79% 學生的論文成績。

宣傳

閱讀:

向上滑動