人工智慧模型可以透過分析我們的語氣來猜測情緒

德國研究人員的一項開創性研究對這個問題給出了響亮的「是」的答案。使用三種模型 機器學習之後，科學家們能夠在短短 1,5 秒的音頻樣本中準確地識別各種情緒。

宣傳

揭開聲音秘密的旅程

發表在《心理學前沿》雜誌上，研究分析了從兩個資料集中提取的無意義句子：一個是加拿大人，一個是德國人。這個策略選擇消除了語言和文化差異的影響，只關注語氣。

每個音訊片段都被仔細修剪到 1,5 秒，這是人類識別語音中的情緒所需的最小長度。這種時間精度確保每個片段代表單一情感，避免重疊和歧義。

情緒焦點

研究重點在於六種基本情緒：快樂、raiva、悲傷、恐懼、厭惡和中立。透過技術 機器學習, 這些模型經過訓練可以識別與每種情緒狀態相關的特定聲音模式。

宣傳

三種模型，三種方法

為了揭開聲音的秘密，研究人員使用了三種不同的語音模型。 機器學習:

深度神經網路 (DNN)： 它們的工作原理類似於複雜的濾波器，分析頻率和音調等聲音成分。例如，提高音調可能表示 raiva 或沮喪。
卷積神經網路 (CNN)： 他們在聲波的圖形表示中尋找視覺模式，類似於我們在聲音的節奏和紋理中識別情緒的方式。
混合模型（C-DNN）： 它結合了先前的兩種技術，使用音訊及其視覺表示來獲得更準確的情緒預測。

有希望的結果和需要克服的挑戰

研究結果令人鼓舞。的型號 機器學習 他們能夠以與人類相似的準確度識別情緒，即使是在缺乏上下文的無意義句子中。

然而，作者也認識到一些局限性。使用的短句可能無法捕捉真實情感中存在的全部細微差別和歧義。此外，未來的研究需要確定準確情緒辨識的最佳音訊持續時間。

宣傳

人機互動的未來

透過語音辨識情緒的能力為人機互動的未來開啟了一系列可能性。想像一下未來，智慧型裝置和虛擬助理可以理解並回應您的情感需求。

這項研究代表了朝這個方向邁出的重要一步，展示了人工智能解碼人類聲音的秘密並創造更具同理心和人性化的介面。

閱讀：

新方法產生 AI 影像的速度提高了 30 倍

麻省理工學院 (MIT) 的研究人員剛剛推出了一種名為「分佈匹配蒸餾」的新方法，能夠更快地產生人工智慧 (AI) 影像，同時保持原始模型的品質。

* 本文的文本部分由人工智慧工具和最先進的語言模型生成，有助於文本的準備、審查、翻譯和摘要。文字條目是由 Curto 來自人工智慧工具的新聞和回應被用來改善最終內容。
需要強調的是，人工智慧工具只是工具，發佈內容的最終責任在於 Curto 消息。透過負責任且合乎道德的方式使用這些工具，我們的目標是擴大溝通的可能性並使優質資訊的獲取民主化。 🤖

宣傳

正在尋找人工智慧工具來讓您的生活更輕鬆？在本指南中，您可以瀏覽人工智慧驅動的機器人目錄並了解它們的功能。看看我們記者團給他們的評價吧！

人工智慧模型可以透過分析我們的語氣來猜測情緒

揭開聲音秘密的旅程

情緒焦點

三種模型，三種方法

有希望的結果和需要克服的挑戰

人機互動的未來

關於作者

伊莎貝拉·卡米諾托

揭開聲音秘密的旅程

情緒焦點

三種模型，三種方法

有希望的結果和需要克服的挑戰

人機互動的未來

關於作者

伊莎貝拉·卡米諾托

邁斯利達斯

有關的