ШІ-модель може вгадувати емоції, аналізуючи наш тон голосу
Автори зображення: Curto Новини/Bing AI

ШІ-модель може вгадувати емоції, аналізуючи наш тон голосу

Голос — це більше, ніж просто засіб спілкування. Це канал розкриття наших найінтимніших емоцій. Якщо розшифровка тонів голосу є природною для нас, людей, чи може штучний інтелект (ШІ) зробити те саме?

Революційне дослідження німецьких дослідників дає однозначну відповідь на це питання. Використовуючи три моделі навчання за допомогою машини, вчені змогли точно розпізнати різні емоції в аудіо зразках всього за 1,5 секунди.

ПУБЛІЦИДА

Подорож до розкриття секретів голосу

Опубліковано в журналі Frontiers in Psychology, дослідження проаналізувало безглузді речення, вилучені з двох наборів даних: канадського та німецького. Цей стратегічний вибір усунув вплив мови та культурних нюансів, зосередившись виключно на тоні голосу.

Кожен аудіозапис був ретельно обрізаний до 1,5 секунди, мінімальної тривалості, необхідної людям для визначення емоцій у мові. Ця часова точність гарантує, що кожен фрагмент представляє єдину емоцію, уникаючи збігів і двозначностей.

Емоції у фокусі

Дослідження було зосереджено на шести основних емоціях: радість, raiva, смуток, страх, огида та нейтралітет. За допомогою прийомів навчання за допомогою машини, моделі навчили розпізнавати специфічні звукові моделі, пов’язані з кожним емоційним станом.

ПУБЛІЦИДА

Три моделі, три підходи

Щоб розкрити секрети голосу, дослідники використовували три різні моделі голосу. навчання за допомогою машини:

  • Глибокі нейронні мережі (DNN): Вони працюють як складні фільтри, аналізуючи компоненти звуку, такі як частота та тон. Наприклад, підвищений тон голосу може вказувати на raiva або розчарування.
  • Згорточні нейронні мережі (CNN): Вони шукають візуальні моделі в графічних представленнях звукових хвиль, подібно до того, як ми ідентифікуємо емоції в ритмі та текстурі голосу.
  • Гібридна модель (C-DNN): Він поєднує дві попередні техніки, використовуючи як аудіо, так і його візуальне представлення, щоб отримати більш точне передбачення емоцій.

Обнадійливі результати та виклики, які потрібно подолати

Результати дослідження були обнадійливими. Моделі навчання за допомогою машини Вони змогли визначити емоції з точністю, подібною до людської, навіть у безглуздих реченнях, позбавлених контексту.

Однак автори визнають деякі обмеження. Використані короткі речення можуть не передати всього спектру нюансів і двозначностей, присутніх у справжніх емоціях. Крім того, потрібні подальші дослідження, щоб визначити оптимальну тривалість звуку для точного розпізнавання емоцій.

ПУБЛІЦИДА

Майбутнє взаємодії людини і машини

Здатність розпізнавати емоції за допомогою голосу відкриває ряд можливостей для майбутньої взаємодії людини і машини. Уявіть собі майбутнє, де розумні пристрої та віртуальні помічники зможуть розуміти ваші емоційні потреби та реагувати на них.

Це дослідження є важливим кроком у цьому напрямку, демонструючи потенціал inteligência штучний щоб розшифрувати секрети людського голосу та створити більш емпатичні та гуманізовані інтерфейси.

Читайте також:

* Текст цієї статті частково створено за допомогою засобів штучного інтелекту, найсучасніших мовних моделей, які допомагають у підготовці, перегляді, перекладі та конспектуванні текстів. Текстові записи були створені Curto Новини та відповіді від інструментів штучного інтелекту були використані для покращення кінцевого вмісту.
Важливо підкреслити, що інструменти штучного інтелекту – це лише інструменти, і остаточна відповідальність за опублікований контент лежить на Curto Новини. Використовуючи ці інструменти відповідально та етично, наша мета полягає в тому, щоб розширити комунікаційні можливості та демократизувати доступ до якісної інформації.
🤖

ПУБЛІЦИДА

Шукаєте інструмент штучного інтелекту, щоб полегшити ваше життя? У цьому посібнику, ви переглядаєте каталог роботів на основі штучного інтелекту та дізнаєтеся про їхні функції. Перегляньте оцінку, яку їм поставила наша команда журналістів!

прокрутки вгору