ChatGPT او در علوم انسانی خوب است اما در علوم دقیق دچار لغزش می شود. تست انجام شده با آزمون Enem را درک کنید

طبق آزمایشی که توسط DeltaFolha انجام شده است، ChatGPT، از OpenAI، او در آزمون Enem خوب عمل کرد و فقط در امتحانات دقیق لغزش کرد. هوش مصنوعی در آزمون های عینی Enem نمره متوسط ​​612,3 را به دست آورد که از 98,9٪ دانش آموزان در علوم انسانی و 95,3٪ در زبان ها و کدها پیشی گرفت.

تجزیه و تحلیل امتیاز هر درس را در نظر گرفت و نشان داد که هوش مصنوعی در Enem عملکرد خوبی خواهد داشت، اما عملکرد آن در ریاضیات پایین در نظر گرفته شد و میانگین 443,1 امتیاز کمتر از میانگین 527,1 داوطلبان انسانی به دست آمد. از سوی دیگر، علوم انسانی، به طرز عجیبی، توسط فناوری گرفته شد. در شبیه سازی، میانگین هوش مصنوعی 725,3 بود که بالاتر از امتیاز 523,3 رقبای واقعی بود.

تبلیغات

برای 70 درصد از مردم ایالات متحده، ChatGPT تحقیقات نشان می دهد قابل اعتماد است
برای 70 درصد از مردم ایالات متحده، ChatGPT تحقیقات نشان می دهد قابل اعتماد است

روش‌شناسی از آزمون‌های Enem در پنج سال گذشته استفاده کرد

ارزیابی از ChatGPT بر اساس پاسخ‌های هوش مصنوعی از آزمایش‌های انجام‌شده در پنج سال گذشته و به ۱۲۹۰ سؤال پاسخ داده شد. روش مورد استفاده در آزمون تئوری پاسخ گویه بود. این مدل ریاضی که توسط Enem اتخاذ شده است، موارد کالیبره شده را بر اساس پارامترهای تشخیص، دشواری و احتمال یک ضربه تصادفی، همانطور که توسط DeltaFolha روایت شده است، پیش بینی می کند. 

A ورق نمره نهایی را محاسبه کرد ChatGPT، با استفاده از تجزیه و تحلیل استاندارد Inep، که در آن ماشین تنها یک بار به هر سوال بدون مثال های قبلی پاسخ داد و جایگزینی را که درست در نظر گرفت را نشان داد.

اگرچه او در علوم انسانی و زبان ها و رمزها سرآمد بود، اما ChatGPT عملکرد پایینی در ریاضیات ارائه کرد که می تواند مانعی برای ورود به دوره های عمومی در دانشگاه های اصلی فدرال کشور باشد. با این حال، هوش مصنوعی در Enem نمره متوسط ​​608,7 را به دست آورد، که بهتر از امتیازی است که 79٪ از دانش آموزان در آن سال به نمره انشا اضافه کردند.

تبلیغات

همچنین بخوانید:

بکش بالا