اے آئی ماڈل ہماری آواز کے لہجے کا تجزیہ کرکے جذبات کا اندازہ لگا سکتا ہے۔

جرمن محققین کا ایک اہم مطالعہ اس سوال کا جواب "ہاں" کے ساتھ دیتا ہے۔ کے تین ماڈلز کا استعمال مشین لرننگسائنس دان صرف 1,5 سیکنڈ کے آڈیو نمونوں میں مختلف جذبات کو درست طریقے سے پہچاننے میں کامیاب رہے۔

ایڈورٹائزنگ

آواز کے رازوں سے پردہ اٹھانے کا سفر

جرنل فرنٹیئرز ان سائیکالوجی میں شائع ہوا، مطالعہ نے دو ڈیٹا سیٹس سے نکالے گئے بیہودہ جملوں کا تجزیہ کیا: ایک کینیڈین اور ایک جرمن۔ اس حکمت عملی کے انتخاب نے زبان اور ثقافتی باریکیوں کے اثر کو ختم کر دیا، صرف آواز کے لہجے پر توجہ مرکوز کی۔

ہر آڈیو کلپ کو احتیاط سے 1,5 سیکنڈ تک تراشا گیا تھا، جس کی کم از کم لمبائی انسانوں کو تقریر میں جذبات کی شناخت کے لیے درکار تھی۔ یہ وقتی درستگی یقینی بناتی ہے کہ ہر ایک ٹکڑا ایک ہی جذبات کی نمائندگی کرتا ہے، اوورلیپ اور ابہام سے بچتا ہے۔

فوکس میں جذبات

مطالعہ نے چھ بنیادی جذبات پر توجہ مرکوز کی: خوشی، آرaiva، اداسی، خوف، نفرت اور غیر جانبداری۔ کی تکنیک کے ذریعے مشین لرننگ, ماڈلز کو ہر جذباتی حالت سے وابستہ مخصوص آواز کے نمونوں کو پہچاننے کی تربیت دی گئی تھی۔

ایڈورٹائزنگ

تین ماڈل، تین نقطہ نظر

آواز کے راز سے پردہ اٹھانے کے لیے محققین نے آواز کے تین مختلف ماڈلز کا استعمال کیا۔ مشین لرننگ:

ڈیپ نیورل نیٹ ورکس (DNNs): وہ پیچیدہ فلٹرز کی طرح کام کرتے ہیں، آواز کے اجزاء جیسے فریکوئنسی اور ٹون کا تجزیہ کرتے ہیں۔ مثال کے طور پر، آواز کی بلندی r کی نشاندہی کر سکتی ہے۔aiva یا مایوسی؟
Convolutional Neural Networks (CNNs): وہ آواز کی لہروں کی گرافک نمائندگی میں بصری نمونوں کی تلاش کرتے ہیں، جس طرح سے ہم آواز کی تال اور ساخت میں جذبات کی شناخت کرتے ہیں۔
ہائبرڈ ماڈل (C-DNN): یہ جذبات کی زیادہ درست پیشین گوئی حاصل کرنے کے لیے آڈیو اور اس کی بصری نمائندگی دونوں کا استعمال کرتے ہوئے، دو پچھلی تکنیکوں کو یکجا کرتا ہے۔

امید افزا نتائج اور چیلنجز پر قابو پانا ہے۔

مطالعہ کے نتائج حوصلہ افزا تھے۔ کے ماڈلز مشین لرننگ وہ سیاق و سباق سے عاری بے معنی جملوں میں بھی انسانوں کی طرح ہی درستگی کے ساتھ جذبات کی شناخت کرنے کے قابل تھے۔

تاہم، مصنفین کچھ حدود کو تسلیم کرتے ہیں. استعمال کیے گئے مختصر جملے حقیقی جذبات میں موجود باریکیوں اور ابہام کی پوری حد کو حاصل نہیں کرسکتے ہیں۔ مزید برآں، جذبات کی درست شناخت کے لیے بہترین آڈیو مدت کا تعین کرنے کے لیے مستقبل کی تحقیق کی ضرورت ہے۔

ایڈورٹائزنگ

انسانی مشین کے تعامل کا مستقبل

آواز کے ذریعے جذبات کو پہچاننے کی صلاحیت انسانی مشین کے تعامل کے مستقبل کے لیے امکانات کی ایک حد کھولتی ہے۔ ایک ایسے مستقبل کا تصور کریں جہاں سمارٹ ڈیوائسز اور ورچوئل اسسٹنٹ آپ کی جذباتی ضروریات کو سمجھ سکیں اور ان کا جواب دے سکیں۔

یہ مطالعہ اس سمت میں ایک اہم قدم کی نمائندگی کرتا ہے، کی صلاحیت کا مظاہرہ کرتا ہے۔ مصنوعی مصنوعی انسانی آواز کے رازوں کو ڈی کوڈ کرنے اور زیادہ ہمدرد اور انسانی انٹرفیس بنانے کے لیے۔

یہ بھی پڑھیں:

نیا طریقہ AI امیجز 30x تیزی سے تیار کرتا ہے۔

میساچوسٹس انسٹی ٹیوٹ آف ٹیکنالوجی (MIT) کے محققین نے ابھی ایک نیا طریقہ متعارف کرایا ہے جسے 'ڈسٹری بیوشن میچنگ ڈسٹلیشن' کہا جاتا ہے - جو اصل ماڈل کے معیار کو برقرار رکھتے ہوئے مصنوعی ذہانت (AI) تصاویر کی تیز تر نسل کو قابل بناتا ہے۔

* اس مضمون کا متن جزوی طور پر مصنوعی ذہانت کے آلات، جدید ترین زبان کے ماڈلز کے ذریعے تیار کیا گیا تھا جو متن کی تیاری، جائزہ، ترجمہ اور خلاصہ میں معاونت کرتے ہیں۔ متن کے اندراجات کی طرف سے بنائے گئے تھے Curto حتمی مواد کو بہتر بنانے کے لیے AI ٹولز سے خبریں اور جوابات استعمال کیے گئے۔
یہ اجاگر کرنا ضروری ہے کہ AI ٹولز صرف ٹولز ہیں، اور شائع شدہ مواد کی حتمی ذمہ داری Curto خبریں ان ٹولز کو ذمہ داری اور اخلاقی طور پر استعمال کرنے سے، ہمارا مقصد مواصلات کے امکانات کو بڑھانا اور معیاری معلومات تک رسائی کو جمہوری بنانا ہے۔ 🤖

ایڈورٹائزنگ

اپنی زندگی کو آسان بنانے کے لیے آرٹیفیشل انٹیلی جنس ٹول کی تلاش ہے؟ اس گائیڈ میں، آپ AI سے چلنے والے روبوٹس کا کیٹلاگ براؤز کرتے ہیں اور ان کی فعالیت کے بارے میں جانتے ہیں۔ ہماری صحافیوں کی ٹیم نے جو اندازہ انہیں دیا اسے دیکھیں!