ChatGPT সে মানবিকে ভালো কিন্তু সঠিক বিজ্ঞানে পিছলে যায়; Enem পরীক্ষা দিয়ে বাহিত পরীক্ষা বুঝতে

বিশ্লেষণে প্রতিটি কোর্সের স্কোর বিবেচনা করা হয়েছে এবং দেখানো হয়েছে যে কৃত্রিম বুদ্ধিমত্তা Enem-এ ভাল পারফরম্যান্স করবে, কিন্তু গণিতে এর পারফরম্যান্স কম বলে বিবেচিত হয়েছে, গড়ে 443,1 পয়েন্ট পেয়েছে, যা মানব প্রার্থীদের 527,1 গড় থেকে কম। অন্যদিকে, মানব বিজ্ঞান, কৌতূহলবশত, প্রযুক্তি দ্বারা নেওয়া হয়েছিল। সিমুলেশনে, AI গড় ছিল 725,3, প্রকৃত প্রতিযোগীদের 523,3 পয়েন্টের চেয়ে বেশি।

বিজ্ঞাপন

মার্কিন যুক্তরাষ্ট্রের 70% মানুষের জন্য, ChatGPT নির্ভরযোগ্য, গবেষণা দেখায়

পদ্ধতি গত পাঁচ বছর থেকে Enem পরীক্ষা ব্যবহার করে

এর মূল্যায়ন ChatGPT 1.290টি প্রশ্নের উত্তর দিয়ে গত পাঁচ বছরে নেওয়া পরীক্ষা থেকে AI প্রতিক্রিয়াগুলির উপর ভিত্তি করে তৈরি করা হয়েছিল। পরীক্ষায় ব্যবহৃত পদ্ধতিটি ছিল আইটেম প্রতিক্রিয়া তত্ত্ব। এনেম দ্বারা গৃহীত এই গাণিতিক মডেলটি বৈষম্য, অসুবিধা এবং এলোমেলো আঘাতের সম্ভাব্যতার পরামিতি অনুসারে ক্রমাঙ্কিত আইটেমগুলির পূর্বাভাস দেয়, যেমন ডেল্টাফোলহা বর্ণনা করেছেন।

A ফোলহা এর চূড়ান্ত গ্রেড গণনা ChatGPT, Inep-এর স্ট্যান্ডার্ড বিশ্লেষণ ব্যবহার করে, যেখানে মেশিনটি পূর্ববর্তী উদাহরণ ব্যতীত প্রতিটি প্রশ্নের উত্তর শুধুমাত্র একবার দিয়েছিল, এটি সঠিক বলে বিবেচিত বিকল্প নির্দেশ করে।

ChatGPT Enem-এ 80% শিক্ষার্থীর চেয়ে ভালো, কিন্তু গণিতে স্লিপ করে https://t.co/RcQbhmFC91
— ফোলহা ডি এস পাওলো (@ফোলা) এপ্রিল 5, 2023

যদিও তিনি মানব বিজ্ঞান এবং ভাষা এবং কোডে পারদর্শী ছিলেন, ChatGPT গণিতে নিম্ন কর্মক্ষমতা উপস্থাপন করেছে, যা দেশের প্রধান ফেডারেল বিশ্ববিদ্যালয়গুলিতে জনপ্রিয় কোর্সে প্রবেশের ক্ষেত্রে বাধা হতে পারে। তবুও, AI Enem-এ গড়ে 608,7 স্কোর পেয়েছে, যে বছর 79% ছাত্রদের দ্বারা প্রাপ্ত স্কোর থেকে ভাল, যখন প্রবন্ধ গ্রেডে যোগ করা হয়েছিল।

বিজ্ঞাপন

আরও পড়ুন:

বিল গেটস questionচিঠি যা কৃত্রিম বুদ্ধিমত্তার বিকাশে বিরতির জন্য অনুরোধ করে