یک مطالعه پیشگامانه توسط محققان آلمانی به این سوال با "بله" قاطع پاسخ می دهد. با استفاده از سه مدل از فراگیری ماشیندانشمندان توانستند احساسات مختلف را در نمونه های صوتی تنها 1,5 ثانیه به دقت تشخیص دهند.
تبلیغات
سفری برای کشف اسرار صدا
منتشر شده در مجله Frontiers in Psychology، این مطالعه جملات مزخرف استخراج شده از دو مجموعه داده را تجزیه و تحلیل کرد: یکی کانادایی و دیگری آلمانی. این انتخاب استراتژیک تأثیر زبان و تفاوتهای فرهنگی را حذف کرد و تنها بر لحن صدا تمرکز کرد.
هر کلیپ صوتی با دقت به 1,5 ثانیه کوتاه شد، حداقل طول مورد نیاز برای انسان برای شناسایی احساسات در گفتار. این دقت زمانی تضمین می کند که هر قطعه یک احساس واحد را نشان می دهد و از همپوشانی ها و ابهامات اجتناب می کند.
احساسات در کانون
این مطالعه بر شش احساس اساسی متمرکز بود: شادی، raiva، غم، ترس، انزجار و بی طرفی. از طریق تکنیک های فراگیری ماشین, مدل ها برای تشخیص الگوهای صوتی خاص مرتبط با هر حالت احساسی آموزش دیده بودند.
تبلیغات
سه مدل، سه رویکرد
برای کشف رازهای صدا، محققان از سه مدل صدای مختلف استفاده کردند. فراگیری ماشین:
- شبکه های عصبی عمیق (DNN): آنها مانند فیلترهای پیچیده کار می کنند و اجزای صدا مانند فرکانس و تن را تجزیه و تحلیل می کنند. برای مثال، صدای بلندتر ممکن است نشانگر r باشدaiva یا ناامیدی
- شبکه های عصبی کانولوشن (CNN): آنها به دنبال الگوهای بصری در نمایش گرافیکی امواج صوتی هستند، شبیه به روشی که ما احساسات را در ریتم و بافت صدا تشخیص می دهیم.
- مدل ترکیبی (C-DNN): این دو تکنیک قبلی را با هم ترکیب می کند و از نمایش صوتی و تصویری آن برای به دست آوردن پیش بینی دقیق تری از احساسات استفاده می کند.
نتایج امیدوار کننده و چالش هایی که باید بر آنها غلبه کرد
نتایج مطالعه دلگرم کننده بود. مدل های فراگیری ماشین آنها توانستند احساسات را با دقتی مشابه انسانها، حتی در جملات بیمعنی و بدون زمینه شناسایی کنند.
با این حال، نویسندگان برخی از محدودیت ها را تشخیص می دهند. جملات کوتاه استفاده شده ممکن است طیف کاملی از ظرایف و ابهامات موجود در احساسات واقعی را نشان ندهند. علاوه بر این، تحقیقات آینده برای تعیین مدت زمان صوتی بهینه برای تشخیص دقیق احساسات مورد نیاز است.
تبلیغات
آینده تعامل انسان و ماشین
توانایی تشخیص احساسات از طریق صدا، طیف وسیعی از احتمالات را برای آینده تعامل انسان و ماشین باز می کند. آینده ای را تصور کنید که در آن دستگاه های هوشمند و دستیاران مجازی بتوانند نیازهای احساسی شما را درک کنند و به آنها پاسخ دهند.
این مطالعه نشان دهنده گام مهمی در این راستا است که پتانسیل را نشان می دهد inteligência مصنوعی رمزگشایی اسرار صدای انسان و ایجاد رابط های همدلانه تر و انسانی تر.
همچنین بخوانید:
* متن این مقاله تا حدی توسط ابزارهای هوش مصنوعی، مدلهای زبانی پیشرفته که در تهیه، بررسی، ترجمه و خلاصهسازی متون کمک میکنند، تولید شده است. ورودی های متنی توسط Curto از اخبار و پاسخهای ابزارهای هوش مصنوعی برای بهبود محتوای نهایی استفاده شد.
مهم است که تأکید کنیم ابزارهای هوش مصنوعی فقط ابزار هستند و مسئولیت نهایی محتوای منتشر شده بر عهده Curto اخبار. با استفاده مسئولانه و اخلاقی از این ابزارها، هدف ما گسترش امکانات ارتباطی و دموکراتیک کردن دسترسی به اطلاعات با کیفیت است. 🤖
تبلیغات
آیا به دنبال ابزار هوش مصنوعی برای آسان کردن زندگی خود هستید؟ در این راهنما، کاتالوگ ربات های مجهز به هوش مصنوعی را مرور می کنید و با عملکردهای آنها آشنا می شوید. ارزیابی تیم خبرنگاران ما را به آنها بررسی کنید!