人工智能模型可以通过分析我们的语气来猜测情绪
图片来源: Curto 新闻/必应AI

人工智能模型可以通过分析我们的语气来猜测情绪

语音不仅仅是一种沟通方式。它是我们最亲密情感的揭示渠道。如果破译语音对我们人类来说是很自然的事情,那么人工智能 (AI) 也能做到同样的事情吗?

德国研究人员的一项开创性研究对这个问题给出了响亮的“是”的答案。使用三种模型 机器学习之后,科学家们能够在短短 1,5 秒的音频样本中准确识别各种情绪。

宣传

揭开声音秘密的旅程

发表在《心理学前沿》杂志上, 该研究分析了从两个数据集中提取的无意义句子:一个是加拿大人,一个是德国人。这一战略选择消除了语言和文化差异的影响,只关注语气。

每个音频片段都被仔细修剪到 1,5 秒,这是人类识别语音中的情绪所需的最小长度。这种时间精度确保每个片段代表单一情感,避免重叠和歧义。

情绪焦点

该研究重点关注六种基本情绪:快乐、raiva、悲伤、恐惧、厌恶和中立。通过技术 机器学习, 这些模型经过训练可以识别与每种情绪状态相关的特定声音模式。

宣传

三种模型,三种方法

为了揭开声音的秘密,研究人员使用了三种不同的语音模型。 机器学习:

  • 深度神经网络 (DNN): 它们的工作原理类似于复杂的滤波器,分析频率和音调等声音成分。例如,提高音调可能表示 raiva 或沮丧。
  • 卷积神经网络 (CNN): 他们在声波的图形表示中寻找视觉模式,类似于我们在声音的节奏和纹理中识别情感的方式。
  • 混合模型(C-DNN): 它结合了之前的两种技术,使用音频及其视觉表示来获得更准确的情绪预测。

有希望的结果和需要克服的挑战

研究结果令人鼓舞。的型号 机器学习 他们能够以与人类相似的准确度识别情绪,即使是在缺乏上下文的无意义句子中。

然而,作者也认识到一些局限性。使用的短句可能无法捕捉真实情感中存在的全部细微差别和歧义。此外,未来的研究需要确定准确情绪识别的最佳音频持续时间。

宣传

人机交互的未来

通过语音识别情绪的能力为人机交互的未来开辟了一系列可能性。想象一下未来,智能设备和虚拟助手可以理解并响应您的情感需求。

这项研究代表了朝这个方向迈出的重要一步,展示了 人工智能 解码人类声音的秘密并创建更具同理心和人性化的界面。

阅读:

* 本文的文本部分由人工智能工具和最先进的语言模型生成,有助于文本的准备、审阅、翻译和摘要。文本条目是由 Curto 来自人工智能工具的新闻和回复被用来改进最终内容。
需要强调的是,人工智能工具只是工具,发布内容的最终责任在于 Curto 消息。通过负责任且合乎道德的方式使用这些工具,我们的目标是扩大沟通的可能性并使优质信息的获取民主化。
🤖

宣传

正在寻找人工智能工具来让您的生活更轻松? 在本指南中,您可以浏览人工智能驱动的机器人目录并了解它们的功能。看看我们记者团给他们的评价吧!

向上滑动