ChatGPT او در علوم انسانی خوب است اما در علوم دقیق دچار لغزش می شود. تست انجام شده با آزمون Enem را درک کنید

تجزیه و تحلیل امتیاز هر درس را در نظر گرفت و نشان داد که هوش مصنوعی در Enem عملکرد خوبی خواهد داشت، اما عملکرد آن در ریاضیات پایین در نظر گرفته شد و میانگین 443,1 امتیاز کمتر از میانگین 527,1 داوطلبان انسانی به دست آمد. از سوی دیگر، علوم انسانی، به طرز عجیبی، توسط فناوری گرفته شد. در شبیه سازی، میانگین هوش مصنوعی 725,3 بود که بالاتر از امتیاز 523,3 رقبای واقعی بود.

تبلیغات

برای 70 درصد از مردم ایالات متحده، ChatGPT تحقیقات نشان می دهد قابل اعتماد است

روش‌شناسی از آزمون‌های Enem در پنج سال گذشته استفاده کرد

ارزیابی از ChatGPT بر اساس پاسخ‌های هوش مصنوعی از آزمایش‌های انجام‌شده در پنج سال گذشته و به ۱۲۹۰ سؤال پاسخ داده شد. روش مورد استفاده در آزمون تئوری پاسخ گویه بود. این مدل ریاضی که توسط Enem اتخاذ شده است، موارد کالیبره شده را بر اساس پارامترهای تشخیص، دشواری و احتمال یک ضربه تصادفی، همانطور که توسط DeltaFolha روایت شده است، پیش بینی می کند.

A ورق نمره نهایی را محاسبه کرد ChatGPT، با استفاده از تجزیه و تحلیل استاندارد Inep، که در آن ماشین تنها یک بار به هر سوال بدون مثال های قبلی پاسخ داد و جایگزینی را که درست در نظر گرفت را نشان داد.

ChatGPT بهتر از 80 درصد دانش آموزان در Enem است، اما در ریاضیات لغزش https://t.co/RcQbhmFC91
- Folha de S.Paulo (@folha) آوریل 5، 2023

اگرچه او در علوم انسانی و زبان ها و رمزها سرآمد بود، اما ChatGPT عملکرد پایینی در ریاضیات ارائه کرد که می تواند مانعی برای ورود به دوره های عمومی در دانشگاه های اصلی فدرال کشور باشد. با این حال، هوش مصنوعی در Enem نمره متوسط 608,7 را به دست آورد، که بهتر از امتیازی است که 79٪ از دانش آموزان در آن سال به نمره انشا اضافه کردند.

تبلیغات

همچنین بخوانید:

بیل گیتس questionنامه ای که خواستار توقف در توسعه هوش مصنوعی است