Az AI-modell hangszínünk elemzésével sejtheti az érzelmeket
Kép forrás: Curto Hírek/Bing AI

Az AI-modell hangszínünk elemzésével sejtheti az érzelmeket

A hang több, mint pusztán kommunikációs eszköz. Ez egy feltáró csatorna a legbensőségesebb érzelmeink számára. Ha nekünk, embereknek természetes a hangszínek megfejtése, vajon a mesterséges intelligencia (AI) is képes erre?

Egy német kutatók úttörő tanulmánya határozott „igen”-nel válaszol erre a kérdésre. Három modell használatával gépi tanulás, a tudósok képesek voltak pontosan felismerni a különféle érzelmeket mindössze 1,5 másodperces hangmintákban.

HIRDETŐ

Utazás a hang titkainak feltárására

Megjelent a Frontiers in Psychology folyóiratban, a tanulmány két adathalmazból kinyert értelmetlen mondatokat elemezte: egy kanadai és egy német. Ez a stratégiai választás megszüntette a nyelvi és kulturális árnyalatok befolyását, és kizárólag a hangszínre összpontosított.

Minden hangfelvételt gondosan 1,5 másodpercre vágtak le, amely a minimális hossz ahhoz, hogy az emberek felismerjék az érzelmeket a beszédben. Ez az időbeli pontosság biztosítja, hogy minden töredék egyetlen érzelmet képviseljen, elkerülve az átfedéseket és a kétértelműségeket.

Fókuszban az érzelmek

A vizsgálat hat alapvető érzelemre összpontosított: öröm, raiva, szomorúság, félelem, undor és semlegesség. A technikákon keresztül gépi tanulás, a modelleket arra képezték ki, hogy felismerjék az egyes érzelmi állapotokhoz kapcsolódó sajátos hangmintákat.

HIRDETŐ

Három modell, három megközelítés

A hang titkainak feltárására a kutatók három különböző hangmodellt használtak. gépi tanulás:

  • Mély idegi hálózatok (DNN-ek): Összetett szűrőként működnek, és olyan hangkomponenseket elemeznek, mint a frekvencia és a hangszín. Például egy emelt hangszín jelezheti az r-taiva vagy frusztráció.
  • Konvolúciós neurális hálózatok (CNN): Vizuális mintákat keresnek a hanghullámok grafikus ábrázolásában, hasonlóan ahhoz, ahogyan a hang ritmusában és textúrájában érzelmeket azonosítunk.
  • Hibrid modell (C-DNN): A két előző technikát ötvözi, mind a hangot, mind a vizuális megjelenítést felhasználva az érzelmek pontosabb előrejelzéséhez.

Ígéretes eredmények és leküzdendő kihívások

A tanulmány eredményei biztatóak voltak. A modellek gépi tanulás Az emberekéhez hasonló pontossággal tudták azonosítani az érzelmeket, még értelmetlen, kontextust nélkülöző mondatokban is.

A szerzők azonban felismernek néhány korlátot. Előfordulhat, hogy a felhasznált rövid mondatok nem ragadják meg a valódi érzelmekben jelenlévő árnyalatok és kétértelműségek teljes skáláját. Továbbá jövőbeli kutatásra van szükség a pontos érzelemfelismeréshez szükséges optimális hangidőtartam meghatározásához.

HIRDETŐ

Az ember-gép interakció jövője

Az érzelmek hangon keresztüli felismerésének képessége számos lehetőséget nyit meg az ember-gép interakció jövője számára. Képzeljen el egy olyan jövőt, ahol az okoseszközök és a virtuális asszisztensek megérthetik érzelmi szükségleteit és reagálhatnak rájuk.

Ez a tanulmány fontos lépést jelent ebbe az irányba, bemutatva a lehetséges lehetőségeket inteligência mesterséges hogy megfejtse az emberi hang titkait, és empatikusabb és humanizáltabb felületeket hozzon létre.

Olvassa el:

* A cikk szövegét részben mesterséges intelligencia eszközök, a legkorszerűbb nyelvi modellek generálták, amelyek segítséget nyújtanak a szövegek elkészítésében, áttekintésében, fordításában és összefoglalásában. A szöveges bejegyzéseket a Curto Az AI-eszközök híreit és válaszait felhasználták a végső tartalom javítására.
Fontos kiemelni, hogy az AI eszközök csak eszközök, és a közzétett tartalomért a végső felelősség a Curto Hírek. Ezen eszközök felelősségteljes és etikus használatával célunk a kommunikációs lehetőségek bővítése és a minőségi információkhoz való hozzáférés demokratizálása.
🤖

HIRDETŐ

Mesterséges intelligencia eszközt keres, amely megkönnyíti életét? Ebben az útmutatóban, böngészheti a mesterséges intelligencia által hajtott robotok katalógusát, és megismerheti funkcióikat. Tekintse meg újságírócsapatunk értékelését!

görgess fel