Egy német kutatók úttörő tanulmánya határozott „igen”-nel válaszol erre a kérdésre. Három modell használatával gépi tanulás, a tudósok képesek voltak pontosan felismerni a különféle érzelmeket mindössze 1,5 másodperces hangmintákban.
HIRDETŐ
Utazás a hang titkainak feltárására
Megjelent a Frontiers in Psychology folyóiratban, a tanulmány két adathalmazból kinyert értelmetlen mondatokat elemezte: egy kanadai és egy német. Ez a stratégiai választás megszüntette a nyelvi és kulturális árnyalatok befolyását, és kizárólag a hangszínre összpontosított.
Minden hangfelvételt gondosan 1,5 másodpercre vágtak le, amely a minimális hossz ahhoz, hogy az emberek felismerjék az érzelmeket a beszédben. Ez az időbeli pontosság biztosítja, hogy minden töredék egyetlen érzelmet képviseljen, elkerülve az átfedéseket és a kétértelműségeket.
Fókuszban az érzelmek
A vizsgálat hat alapvető érzelemre összpontosított: öröm, raiva, szomorúság, félelem, undor és semlegesség. A technikákon keresztül gépi tanulás, a modelleket arra képezték ki, hogy felismerjék az egyes érzelmi állapotokhoz kapcsolódó sajátos hangmintákat.
HIRDETŐ
Három modell, három megközelítés
A hang titkainak feltárására a kutatók három különböző hangmodellt használtak. gépi tanulás:
- Mély idegi hálózatok (DNN-ek): Összetett szűrőként működnek, és olyan hangkomponenseket elemeznek, mint a frekvencia és a hangszín. Például egy emelt hangszín jelezheti az r-taiva vagy frusztráció.
- Konvolúciós neurális hálózatok (CNN): Vizuális mintákat keresnek a hanghullámok grafikus ábrázolásában, hasonlóan ahhoz, ahogyan a hang ritmusában és textúrájában érzelmeket azonosítunk.
- Hibrid modell (C-DNN): A két előző technikát ötvözi, mind a hangot, mind a vizuális megjelenítést felhasználva az érzelmek pontosabb előrejelzéséhez.
Ígéretes eredmények és leküzdendő kihívások
A tanulmány eredményei biztatóak voltak. A modellek gépi tanulás Az emberekéhez hasonló pontossággal tudták azonosítani az érzelmeket, még értelmetlen, kontextust nélkülöző mondatokban is.
A szerzők azonban felismernek néhány korlátot. Előfordulhat, hogy a felhasznált rövid mondatok nem ragadják meg a valódi érzelmekben jelenlévő árnyalatok és kétértelműségek teljes skáláját. Továbbá jövőbeli kutatásra van szükség a pontos érzelemfelismeréshez szükséges optimális hangidőtartam meghatározásához.
HIRDETŐ
Az ember-gép interakció jövője
Az érzelmek hangon keresztüli felismerésének képessége számos lehetőséget nyit meg az ember-gép interakció jövője számára. Képzeljen el egy olyan jövőt, ahol az okoseszközök és a virtuális asszisztensek megérthetik érzelmi szükségleteit és reagálhatnak rájuk.
Ez a tanulmány fontos lépést jelent ebbe az irányba, bemutatva a lehetséges lehetőségeket inteligência mesterséges hogy megfejtse az emberi hang titkait, és empatikusabb és humanizáltabb felületeket hozzon létre.
Olvassa el:
* A cikk szövegét részben mesterséges intelligencia eszközök, a legkorszerűbb nyelvi modellek generálták, amelyek segítséget nyújtanak a szövegek elkészítésében, áttekintésében, fordításában és összefoglalásában. A szöveges bejegyzéseket a Curto Az AI-eszközök híreit és válaszait felhasználták a végső tartalom javítására.
Fontos kiemelni, hogy az AI eszközök csak eszközök, és a közzétett tartalomért a végső felelősség a Curto Hírek. Ezen eszközök felelősségteljes és etikus használatával célunk a kommunikációs lehetőségek bővítése és a minőségi információkhoz való hozzáférés demokratizálása. 🤖
HIRDETŐ
Mesterséges intelligencia eszközt keres, amely megkönnyíti életét? Ebben az útmutatóban, böngészheti a mesterséges intelligencia által hajtott robotok katalógusát, és megismerheti funkcióikat. Tekintse meg újságírócsapatunk értékelését!