GPT-4 গণিতের কাজগুলিতে সঠিকতা হ্রাস দেখায়, স্ট্যানফোর্ড গবেষণায় দেখা গেছে

স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের একটি গবেষণায় দেখা গেছে যে GPT-4, থেকে OpenAI, বিভিন্ন কাজের মিশ্র ফলাফল দেখায়। নেচার জার্নালে প্রকাশিত এই সমীক্ষায় দেখা গেছে যে জিপিটি -4 এর চেয়ে ভাল কাজ করেছে ChatGPT, গণিত, প্রোগ্রামিং এবং ভিজ্যুয়াল রিজনিং টাস্কে আরেকটি দুর্দান্ত ভাষা মডেল। যাইহোক, GPT-4 একটি গণিত কাজের নির্ভুলতার হ্রাসও দেখিয়েছে, যা গুণমানের হ্রাসের পরিবর্তে মডেল আচরণের পরিবর্তনের জন্য দায়ী হতে পারে।

গবেষণা গবেষকরা বলেছেন যে GPT-4 একটি শক্তিশালী ভাষা মডেল যা বিভিন্ন কাজের জন্য ব্যবহার করা যেতে পারে। যাইহোক, তারা আরও বলেছে যে এটির সীমাবদ্ধতা সম্পর্কে সচেতন হওয়া এবং সঠিক পরীক্ষার অনুশীলনে এটি অন্তর্ভুক্ত করা গুরুত্বপূর্ণ।

বিজ্ঞাপন

O অধ্যয়ন স্ট্যানফোর্ড থেকে, শিরোনাম "কিভাবে মানুষের আচরণ করে ChatGPT এটা কি সময়ের সাথে সাথে পরিবর্তিত হচ্ছে?” বড় ভাষার মডেলের কর্মক্ষমতা মূল্যায়ন করা গবেষণার একটি সিরিজের সর্বশেষতম। এই গবেষণায় দেখানো হয়েছে যে বৃহৎ ভাষার মডেলগুলি বিভিন্ন কাজের জন্য ব্যবহার করা যেতে পারে, তবে তারা এটিও দেখিয়েছে যে তাদের সীমাবদ্ধতা রয়েছে। বড় ভাষা মডেল ব্যবহার করার সময় এই সীমাবদ্ধতা সম্পর্কে সচেতন হওয়া গুরুত্বপূর্ণ।

সম্পূর্ণ স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের অধ্যয়ন এখানে দেখা যাবে লিংক

খুব দেখুন:

উপরে স্ক্রল কর