ChatGPT إنه جيد في العلوم الإنسانية ولكنه زلات في العلوم الدقيقة؛ فهم الاختبار الذي تم إجراؤه باستخدام اختبار Enem

وفقا للاختبار الذي أجرته شركة DeltaFolha، فإن ChatGPT، من OpenAIلقد كان أداؤه جيدًا في اختبار Enem، ولم يتراجع إلا في الاختبارات الدقيقة. وحصل الذكاء الاصطناعي على متوسط ​​612,3 في اختبارات Enem الموضوعية، متجاوزا 98,9% من الطلاب في العلوم الإنسانية و95,3% في اللغات والرموز.

أخذ التحليل في الاعتبار نتيجة كل دورة وأظهر أن الذكاء الاصطناعي سيحقق أداءً جيدًا في Enem، إلا أن أدائه في الرياضيات كان يعتبر منخفضًا، حيث حصل على متوسط ​​443,1 نقطة، أي أقل من متوسط ​​527,1 للمرشحين من البشر. ومن ناحية أخرى، من الغريب أن العلوم الإنسانية قد تأثرت بالتكنولوجيا. وفي المحاكاة، بلغ متوسط ​​الذكاء الاصطناعي 725,3، وهو أعلى من 523,3 نقطة للمنافسين الحقيقيين.

شهره اعلاميه

بالنسبة لـ 70% من الأشخاص في الولايات المتحدة، ChatGPT موثوقة، وتظهر الأبحاث
بالنسبة لـ 70% من الأشخاص في الولايات المتحدة، ChatGPT موثوقة، وتظهر الأبحاث

استخدمت المنهجية اختبارات Enem من السنوات الخمس الماضية

تقييم ChatGPT واستند إلى استجابات الذكاء الاصطناعي من الاختبارات التي تم إجراؤها على مدى السنوات الخمس الماضية، والإجابة على 1.290 سؤالاً. المنهجية المستخدمة في الاختبار هي نظرية الاستجابة للعنصر. يتنبأ هذا النموذج الرياضي الذي اعتمدته Enem بالعناصر التي تمت معايرتها وفقًا لمعايير التمييز وصعوبة واحتمال الضربة العشوائية، كما رواه DeltaFolha. 

A فولها حساب الدرجة النهائية لل ChatGPTوذلك باستخدام تحليل إنيب القياسي، والذي تجيب فيه الآلة على كل سؤال مرة واحدة فقط، دون أمثلة سابقة، مع الإشارة إلى البديل الذي تعتبره صحيحا.

ورغم تفوقه في العلوم الإنسانية واللغات والرموز، إلا أن ChatGPT قدموا أداءً منخفضًا في الرياضيات، مما قد يشكل عائقًا أمام الالتحاق بالدورات الشعبية في الجامعات الفيدرالية الرئيسية في البلاد. ومع ذلك، حصل الذكاء الاصطناعي على متوسط ​​درجات 608,7 في اختبار Enem، وهو أفضل من تلك التي حصل عليها 79% من الطلاب في ذلك العام، عند إضافتها إلى درجة المقال.

شهره اعلاميه

يقرأ أيضا:

انتقل إلى أعلى