AI моделът може да познае емоциите, като анализира тона на гласа ни
Кредити за изображения: Curto Новини/Bing AI

AI моделът може да познае емоциите, като анализира тона на гласа ни

Гласът е нещо повече от средство за комуникация. Това е разкриващ канал за нашите най-интимни емоции. Ако дешифрирането на гласовите тонове е естествено за нас, хората, може ли изкуственият интелект (AI) също да направи същото?

Революционно проучване на немски изследователи отговаря на този въпрос с категоричното „да“. Използвайки три модела на машинно обучение, учените успяха да разпознаят точно различни емоции в аудио проби от само 1,5 секунди.

ПУБЛИЧНОСТ

Пътуването за разкриване на тайните на гласа

Публикувано в списанието Frontiers in Psychology, проучването анализира безсмислени изречения, извлечени от два набора от данни: един канадски и един немски. Този стратегически избор елиминира влиянието на езика и културните нюанси, като се фокусира единствено върху тона на гласа.

Всеки аудио клип беше внимателно съкратен до 1,5 секунди, минималната дължина, необходима на хората, за да идентифицират емоциите в речта. Тази времева прецизност гарантира, че всеки фрагмент представлява една емоция, като се избягват припокривания и неясноти.

Емоциите на фокус

Проучването се фокусира върху шест основни емоции: радост, raiva, тъга, страх, отвращение и неутралност. Чрез техники на машинно обучение, моделите бяха обучени да разпознават специфичните звукови модели, свързани с всяко емоционално състояние.

ПУБЛИЧНОСТ

Три модела, три подхода

За да разкрият тайните на гласа, изследователите са използвали три различни гласови модела. машинно обучение:

  • Дълбоки невронни мрежи (DNN): Те работят като сложни филтри, като анализират звукови компоненти като честота и тон. Например, повишен тон на гласа може да означава raiva или разочарование.
  • Конволюционни невронни мрежи (CNN): Те търсят визуални модели в графичните представяния на звуковите вълни, подобно на начина, по който идентифицираме емоциите в ритъма и текстурата на гласа.
  • Хибриден модел (C-DNN): Той съчетава двете предишни техники, като използва както аудио, така и визуално представяне, за да получи по-точно предсказване на емоциите.

Обещаващи резултати и предизвикателства за преодоляване

Резултатите от проучването бяха обнадеждаващи. Моделите на машинно обучение Те успяха да идентифицират емоциите с точност, подобна на тази на хората, дори в безсмислени изречения, лишени от контекст.

Авторите обаче признават някои ограничения. Използваните кратки изречения може да не уловят пълния набор от нюанси и неясноти, присъстващи в истинските емоции. Освен това са необходими бъдещи изследвания, за да се определи оптималната продължителност на звука за точно разпознаване на емоции.

ПУБЛИЧНОСТ

Бъдещето на взаимодействието човек-машина

Способността за разпознаване на емоции чрез глас отваря набор от възможности за бъдещето на взаимодействието човек-машина. Представете си бъдеще, в което интелигентните устройства и виртуалните асистенти могат да разбират и отговарят на вашите емоционални нужди.

Това проучване представлява важна стъпка в тази посока, демонстрирайки потенциала на изкуствен интелект за декодиране на тайните на човешкия глас и създаване на по-съпричастни и хуманизирани интерфейси.

Прочетете също така:

* Текстът на тази статия е частично генериран от инструменти за изкуствен интелект, най-съвременни езикови модели, които подпомагат подготовката, прегледа, превода и резюмирането на текстове. Текстовите записи са създадени от Curto Новини и отговори от AI инструменти бяха използвани за подобряване на крайното съдържание.
Важно е да се подчертае, че AI инструментите са само инструменти и крайната отговорност за публикуваното съдържание се носи от Curto Новини. Като използваме тези инструменти отговорно и етично, нашата цел е да разширим възможностите за комуникация и да демократизираме достъпа до качествена информация.
🤖

ПУБЛИЧНОСТ

Търсите инструмент за изкуствен интелект, който да улесни живота ви? В това ръководство, преглеждате каталог с работещи с AI роботи и научавате за техните функционалности. Вижте оценката, която им даде нашият журналистически екип!

превъртете нагоре