AI-modell kan gissa känslor genom att analysera vårt tonfall
Bildkrediter: Curto Nyheter/Bing AI

AI-modell kan gissa känslor genom att analysera vårt tonfall

Röst är mer än bara ett kommunikationsmedel. Det är en avslöjande kanal för våra mest intima känslor. Om att dechiffrera rösttoner är naturligt för oss människor, kan artificiell intelligens (AI) också göra detsamma?

En banbrytande studie av tyska forskare svarar på den frågan med ett rungande "ja". Använder tre modeller av maskininlärning, kunde forskare noggrant känna igen olika känslor i ljudprover på bara 1,5 sekunder.

REKLAM

Resan för att avslöja röstens hemligheter

Publicerad i tidskriften Frontiers in Psychology, studien analyserade nonsensmeningar extraherade från två datauppsättningar: en kanadensisk och en tysk. Detta strategiska val eliminerade inflytandet av språk och kulturella nyanser, och fokuserade enbart på tonfall.

Varje ljudklipp trimmades noggrant till 1,5 sekunder, den minsta längd som behövs för att människor ska kunna identifiera känslor i tal. Denna tidsmässiga precision säkerställer att varje fragment representerar en enda känsla och undviker överlappningar och tvetydigheter.

Känslor i fokus

Studien fokuserade på sex grundläggande känslor: glädje, raiva, sorg, rädsla, avsky och neutralitet. Genom tekniker för maskininlärning, modellerna tränades att känna igen de specifika ljudmönster som är förknippade med varje känslomässigt tillstånd.

REKLAM

Tre modeller, tre tillvägagångssätt

För att avslöja röstens hemligheter använde forskarna tre olika röstmodeller. maskininlärning:

  • Deep Neural Networks (DNN): De fungerar som komplexa filter och analyserar ljudkomponenter som frekvens och ton. Till exempel kan ett höjt tonfall indikera raiva eller frustration.
  • Convolutional Neural Networks (CNN): De letar efter visuella mönster i de grafiska representationerna av ljudvågor, på samma sätt som vi identifierar känslor i röstens rytm och textur.
  • Hybridmodell (C-DNN): Den kombinerar de två tidigare teknikerna och använder både ljud och dess visuella representation för att få en mer exakt förutsägelse av känslor.

Lovande resultat och utmaningar som ska övervinnas

Resultaten av studien var uppmuntrande. Modellerna av maskininlärning De kunde identifiera känslor med en precision som liknar människors, även i meningslösa meningar utan sammanhang.

Men författarna erkänner vissa begränsningar. De korta meningarna som används kanske inte fångar hela skalan av nyanser och oklarheter som finns i verkliga känslor. Dessutom behövs framtida forskning för att bestämma den optimala ljudlängden för korrekt känslouttolkning.

REKLAM

Framtiden för interaktion mellan människa och maskin

Förmågan att känna igen känslor genom röst öppnar en rad möjligheter för framtiden för människa-maskin-interaktion. Föreställ dig en framtid där smarta enheter och virtuella assistenter kan förstå och svara på dina känslomässiga behov.

Denna studie representerar ett viktigt steg i denna riktning och visar potentialen för inteligência artificiell att avkoda den mänskliga röstens hemligheter och skapa mer empatiska och humaniserade gränssnitt.

Läs också:

* Texten i den här artikeln genererades delvis av verktyg för artificiell intelligens, toppmoderna språkmodeller som hjälper till att förbereda, granska, översätta och sammanfatta texter. Textposter skapades av Curto Nyheter och svar från AI-verktyg användes för att förbättra det slutliga innehållet.
Det är viktigt att betona att AI-verktyg bara är verktyg, och det slutliga ansvaret för det publicerade innehållet ligger hos Curto Nyheter. Genom att använda dessa verktyg på ett ansvarsfullt och etiskt sätt är vårt mål att utöka kommunikationsmöjligheterna och demokratisera tillgången till kvalitetsinformation.
🤖

REKLAM

Letar du efter ett artificiell intelligensverktyg för att göra ditt liv enklare? I den här guiden, bläddrar du i en katalog med AI-drivna robotar och lär dig om deras funktioner. Kolla in utvärderingen som vårt team av journalister gav dem!

skrolla upp