El model d'IA pot endevinar les emocions mitjançant l'anàlisi del nostre to de veu
Crèdits d'imatge: Curto Notícies/Bing AI

El model d'IA pot endevinar les emocions mitjançant l'anàlisi del nostre to de veu

La veu és més que un mitjà de comunicació. És un canal revelador per a les nostres emocions més íntimes. Si desxifrar els tons de veu és natural per als humans, la intel·ligència artificial (IA) també pot fer el mateix?

Un estudi innovador d'investigadors alemanys respon aquesta pregunta amb un rotund "sí". Utilitzant tres models de màquina d'aprenentatge, els científics van poder reconèixer amb precisió diverses emocions en mostres d'àudio de només 1,5 segons.

PUBLICITAT

El viatge per descobrir els secrets de la veu

Publicat a la revista Frontiers in Psychology, l'estudi va analitzar frases sense sentit extretes de dos conjunts de dades: un canadenc i un altre alemany. Aquesta elecció estratègica va eliminar la influència de la llengua i els matisos culturals, centrant-se únicament en el to de veu.

Cada clip d'àudio es va retallar amb cura a 1,5 segons, la durada mínima necessària perquè els humans identifiquin les emocions en la parla. Aquesta precisió temporal assegura que cada fragment representi una única emoció, evitant solapaments i ambigüitats.

Emocions en focus

L'estudi es va centrar en sis emocions bàsiques: alegria, raiva, tristesa, por, fàstic i neutralitat. Mitjançant tècniques de màquina d'aprenentatge, els models van ser entrenats per reconèixer els patrons sonors específics associats a cada estat emocional.

PUBLICITAT

Tres models, tres enfocaments

Per descobrir els secrets de la veu, els investigadors van utilitzar tres models de veu diferents. màquina d'aprenentatge:

  • Xarxes neuronals profundes (DNN): Funcionen com filtres complexos, analitzant components del so com la freqüència i el to. Per exemple, un to de veu elevat pot indicar raiva o frustració.
  • Xarxes neuronals convolucionals (CNN): Busquen patrons visuals en les representacions gràfiques de les ones sonores, semblants a la manera com identifiquem les emocions en el ritme i la textura de la veu.
  • Model híbrid (C-DNN): Combina les dues tècniques anteriors, utilitzant tant l'àudio com la seva representació visual per obtenir una predicció més acurada de les emocions.

Resultats prometedors i reptes a superar

Els resultats de l'estudi van ser encoratjadors. Els models de màquina d'aprenentatge Van ser capaços d'identificar les emocions amb una precisió similar a la dels humans, fins i tot en frases sense sentit i sense context.

Tanmateix, els autors reconeixen algunes limitacions. Les frases curtes utilitzades poden no captar tota la gamma de matisos i ambigüitats presents en les emocions reals. A més, es necessiten investigacions futures per determinar la durada d'àudio òptima per al reconeixement precís de les emocions.

PUBLICITAT

El futur de la interacció home-màquina

La capacitat de reconèixer les emocions a través de la veu obre un ventall de possibilitats per al futur de la interacció home-màquina. Imagineu un futur on els dispositius intel·ligents i els assistents virtuals puguin entendre i respondre a les vostres necessitats emocionals.

Aquest estudi representa un pas important en aquesta direcció, demostrant el potencial de intel·ligència artificial per descodificar els secrets de la veu humana i crear interfícies més empàtiques i humanitzades.

Llegiu també:

* El text d'aquest article ha estat generat parcialment per eines d'intel·ligència artificial, models de llenguatge d'última generació que ajuden a la preparació, revisió, traducció i resum de textos. Les entrades de text les va crear Curto Les notícies i les respostes d'eines d'IA es van utilitzar per millorar el contingut final.
És important destacar que les eines d'IA són només eines i la responsabilitat final del contingut publicat recau en el Curto Notícies. Amb un ús responsable i ètic d'aquestes eines, el nostre objectiu és ampliar les possibilitats de comunicació i democratitzar l'accés a la informació de qualitat.
🤖

PUBLICITAT

Busques una eina d'Intel·ligència Artificial que et faci la vida més fàcil? En aquesta guia, navegueu per un catàleg de robots impulsats per IA i apreneu sobre les seves funcionalitats. Consulteu la valoració que els va fer el nostre equip de periodistes!

Desplaçar-se cap amunt