বিশ্লেষণে প্রতিটি কোর্সের স্কোর বিবেচনা করা হয়েছে এবং দেখানো হয়েছে যে কৃত্রিম বুদ্ধিমত্তা Enem-এ ভাল পারফরম্যান্স করবে, কিন্তু গণিতে এর পারফরম্যান্স কম বলে বিবেচিত হয়েছে, গড়ে 443,1 পয়েন্ট পেয়েছে, যা মানব প্রার্থীদের 527,1 গড় থেকে কম। অন্যদিকে, মানব বিজ্ঞান, কৌতূহলবশত, প্রযুক্তি দ্বারা নেওয়া হয়েছিল। সিমুলেশনে, AI গড় ছিল 725,3, প্রকৃত প্রতিযোগীদের 523,3 পয়েন্টের চেয়ে বেশি।
বিজ্ঞাপন
পদ্ধতি গত পাঁচ বছর থেকে Enem পরীক্ষা ব্যবহার করে
এর মূল্যায়ন ChatGPT 1.290টি প্রশ্নের উত্তর দিয়ে গত পাঁচ বছরে নেওয়া পরীক্ষা থেকে AI প্রতিক্রিয়াগুলির উপর ভিত্তি করে তৈরি করা হয়েছিল। পরীক্ষায় ব্যবহৃত পদ্ধতিটি ছিল আইটেম প্রতিক্রিয়া তত্ত্ব। এনেম দ্বারা গৃহীত এই গাণিতিক মডেলটি বৈষম্য, অসুবিধা এবং এলোমেলো আঘাতের সম্ভাব্যতার পরামিতি অনুসারে ক্রমাঙ্কিত আইটেমগুলির পূর্বাভাস দেয়, যেমন ডেল্টাফোলহা বর্ণনা করেছেন।
A ফোলহা এর চূড়ান্ত গ্রেড গণনা ChatGPT, Inep-এর স্ট্যান্ডার্ড বিশ্লেষণ ব্যবহার করে, যেখানে মেশিনটি পূর্ববর্তী উদাহরণ ব্যতীত প্রতিটি প্রশ্নের উত্তর শুধুমাত্র একবার দিয়েছিল, এটি সঠিক বলে বিবেচিত বিকল্প নির্দেশ করে।
যদিও তিনি মানব বিজ্ঞান এবং ভাষা এবং কোডে পারদর্শী ছিলেন, ChatGPT গণিতে নিম্ন কর্মক্ষমতা উপস্থাপন করেছে, যা দেশের প্রধান ফেডারেল বিশ্ববিদ্যালয়গুলিতে জনপ্রিয় কোর্সে প্রবেশের ক্ষেত্রে বাধা হতে পারে। তবুও, AI Enem-এ গড়ে 608,7 স্কোর পেয়েছে, যে বছর 79% ছাত্রদের দ্বারা প্রাপ্ত স্কোর থেকে ভাল, যখন প্রবন্ধ গ্রেডে যোগ করা হয়েছিল।
বিজ্ঞাপন
আরও পড়ুন: