人工智慧模型可以透過分析我們的語氣來猜測情緒
圖片來源: Curto 新聞/必應AI

人工智慧模型可以透過分析我們的語氣來猜測情緒

語音不僅僅是一種溝通方式。它是我們最親密情感的揭示管道。如果破解語音對我們人類來說是很自然的事情,那麼人工智慧 (AI) 也能做到同樣的事情嗎?

德國研究人員的一項開創性研究對這個問題給出了響亮的「是」的答案。使用三種模型 機器學習之後,科學家們能夠在短短 1,5 秒的音頻樣本中準確地識別各種情緒。

宣傳

揭開聲音秘密的旅程

發表在《心理學前沿》雜誌上, 研究分析了從兩個資料集中提取的無意義句子:一個是加拿大人,一個是德國人。這個策略選擇消除了語言和文化差異的影響,只關注語氣。

每個音訊片段都被仔細修剪到 1,5 秒,這是人類識別語音中的情緒所需的最小長度。這種時間精度確保每個片段代表單一情感,避免重疊和歧義。

情緒焦點

研究重點在於六種基本情緒:快樂、raiva、悲傷、恐懼、厭惡和中立。透過技術 機器學習, 這些模型經過訓練可以識別與每種情緒狀態相關的特定聲音模式。

宣傳

三種模型,三種方法

為了揭開聲音的秘密,研究人員使用了三種不同的語音模型。 機器學習:

  • 深度神經網路 (DNN): 它們的工作原理類似於複雜的濾波器,分析頻率和音調等聲音成分。例如,提高音調可能表示 raiva 或沮喪。
  • 卷積神經網路 (CNN): 他們在聲波的圖形表示中尋找視覺模式,類似於我們在聲音的節奏和紋理中識別情緒的方式。
  • 混合模型(C-DNN): 它結合了先前的兩種技術,使用音訊及其視覺表示來獲得更準確的情緒預測。

有希望的結果和需要克服的挑戰

研究結果令人鼓舞。的型號 機器學習 他們能夠以與人類相似的準確度識別情緒,即使是在缺乏上下文的無意義句子中。

然而,作者也認識到一些局限性。使用的短句可能無法捕捉真實情感中存在的全部細微差別和歧義。此外,未來的研究需要確定準確情緒辨識的最佳音訊持續時間。

宣傳

人機互動的未來

透過語音辨識情緒的能力為人機互動的未來開啟了一系列可能性。想像一下未來,智慧型裝置和虛擬助理可以理解並回應您的情感需求。

這項研究代表了朝這個方向邁出的重要一步,展示了 人工智能 解碼人類聲音的秘密並創造更具同理心和人性化的介面。

閱讀:

* 本文的文本部分由人工智慧工具和最先進的語言模型生成,有助於文本的準備、審查、翻譯和摘要。文字條目是由 Curto 來自人工智慧工具的新聞和回應被用來改善最終內容。
需要強調的是,人工智慧工具只是工具,發佈內容的最終責任在於 Curto 消息。透過負責任且合乎道德的方式使用這些工具,我們的目標是擴大溝通的可能性並使優質資訊的獲取民主化。
🤖

宣傳

正在尋找人工智慧工具來讓您的生活更輕鬆? 在本指南中,您可以瀏覽人工智慧驅動的機器人目錄並了解它們的功能。看看我們記者團給他們的評價吧!

向上滑動