ChatGPT 他擅长人文学科,但在精确科学方面却表现不佳。了解 Enem 考试进行的测试

根据 DeltaFolha 进行的测试, ChatGPT因为 OpenAI,他在 Enem 测试中表现出色,只是在精确考试中滑落了。 AI在Enem客观测试中获得了612,3的平均分,超过了人文科学专业98,9%的学生以及语言和代码专业95,3%的学生。

分析考虑了每门课程的分数,结果显示人工智能在 Enem 中表现良好,但在数学方面的表现被认为较低,平均得分为 443,1 分,低于人类考生的平均分 527,1 分。另一方面,令人好奇的是,人文科学却被技术所取代。模拟中,AI平均分为725,3,高于真实选手的523,3分。

宣传

对于 70% 的美国人来说, ChatGPT 研究表明,这是可靠的
对于 70% 的美国人来说, ChatGPT 研究表明,这是可靠的

方法使用过去五年的 Enem 测试

的评估 ChatGPT 基于过去 1.290 年测试中人工智能的回答,回答了 XNUMX 个问题。测试中使用的方法是项目反应理论。正如 DeltaFolha 所叙述的那样,Enem 采用的这种数学模型根据随机命中的辨别力、难度和概率参数来预测项目。 

A Folha 计算出最终成绩 ChatGPT,使用 Inep 的标准分析,其中机器仅回答每个问题一次,没有先前的示例,表明它认为正确的替代方案。

尽管他在人文科学以及语言和代码方面表现出色, ChatGPT 数学成绩不佳,这可能成为进入该国主要联邦大学热门课程的障碍。即便如此,AI 在 Enem 上的平均成绩为 608,7,高于当年 79% 学生的论文成绩。

宣传

阅读:

向上滑动