AI 모델은 목소리 톤을 분석하여 감정을 추측할 수 있습니다.
이미지 크레딧: Curto 뉴스/빙 AI

AI 모델은 목소리 톤을 분석하여 감정을 추측할 수 있습니다.

음성은 단순한 의사소통 수단 그 이상입니다. 그것은 우리의 가장 친밀한 감정을 드러내는 채널입니다. 음성 톤을 해독하는 것이 인간에게 자연스러운 일이라면 인공지능(AI)도 같은 일을 할 수 있을까요?

독일 연구원들의 획기적인 연구는 이 질문에 단호하게 "그렇다"고 답했습니다. 세 가지 모델을 사용하여 기계 학습, 과학자들은 단 1,5초의 오디오 샘플에서 다양한 감정을 정확하게 인식할 수 있었습니다.

널리 알려짐

목소리의 비밀을 밝히는 여정

심리학의 프론티어(Frontiers in Psychology) 저널에 게재됨, 이 연구는 두 개의 데이터 세트(캐나다 및 독일)에서 추출된 넌센스 문장을 분석했습니다. 이 전략적 선택은 언어와 문화적 뉘앙스의 영향을 제거하고 목소리 톤에만 초점을 맞췄습니다.

각 오디오 클립은 인간이 말에서 감정을 식별하는 데 필요한 최소 길이인 1,5초로 조심스럽게 다듬었습니다. 이러한 시간적 정확성을 통해 각 조각이 단일 감정을 나타내므로 중복과 모호함이 방지됩니다.

감정에 집중하다

연구는 여섯 가지 기본 감정인 기쁨, r에 초점을 맞췄습니다.aiva, 슬픔, 두려움, 혐오감 및 중립성. 기술을 통해 기계 학습, 모델은 각 감정 상태와 관련된 특정 소리 패턴을 인식하도록 훈련되었습니다.

널리 알려짐

세 가지 모델, 세 가지 접근 방식

음성의 비밀을 밝히기 위해 연구자들은 세 가지 음성 모델을 사용했습니다. 기계 학습:

  • 심층 신경망(DNN): 이는 복잡한 필터처럼 작동하여 주파수 및 톤과 같은 사운드 구성 요소를 분석합니다. 예를 들어, 목소리 톤이 높아지면 r을 의미할 수 있습니다.aiva 또는 좌절.
  • 컨볼루셔널 신경망(CNN): 그들은 음성의 리듬과 질감에서 감정을 식별하는 방식과 유사하게 음파의 그래픽 표현에서 시각적 패턴을 찾습니다.
  • 하이브리드 모델(C-DNN): 이는 오디오와 시각적 표현을 모두 사용하여 감정을 보다 정확하게 예측하는 두 가지 이전 기술을 결합합니다.

유망한 결과와 극복해야 할 과제

연구 결과는 고무적이었습니다. 모델 기계 학습 그들은 맥락이 없는 무의미한 문장에서도 인간과 비슷한 정확도로 감정을 식별할 수 있었습니다.

그러나 저자는 몇 가지 한계를 인식하고 있습니다. 사용된 짧은 문장은 실제 감정에 존재하는 모든 범위의 뉘앙스와 모호함을 포착하지 못할 수도 있습니다. 또한 정확한 감정 인식을 위한 최적의 오디오 지속 시간을 결정하기 위한 향후 연구가 필요합니다.

널리 알려짐

인간-기계 상호작용의 미래

음성을 통해 감정을 인식하는 능력은 인간-기계 상호 작용의 미래에 대한 다양한 가능성을 열어줍니다. 스마트 장치와 가상 비서가 귀하의 정서적 요구를 이해하고 이에 응답할 수 있는 미래를 상상해 보십시오.

본 연구는 이러한 방향으로의 중요한 단계를 나타내며, 인텔리 전시 아 인공 인간 목소리의 비밀을 해독하고 더욱 공감적이고 인간화된 인터페이스를 만드는 것입니다.

또한 읽기 :

* 이 기사의 텍스트는 텍스트 준비, 검토, 번역 및 요약을 지원하는 최첨단 언어 모델인 인공 지능 도구를 통해 부분적으로 생성되었습니다. 텍스트 항목은 다음에 의해 생성되었습니다. Curto AI 도구의 뉴스와 답변을 활용해 최종 콘텐츠를 개선했습니다.
AI 도구는 도구일 뿐이며 게시된 콘텐츠에 대한 최종 책임은 AI에게 있다는 점을 강조하는 것이 중요합니다. Curto 소식. 이러한 도구를 책임감 있고 윤리적으로 사용함으로써 우리의 목표는 커뮤니케이션 가능성을 확대하고 고품질 정보에 대한 접근을 민주화하는 것입니다.
🤖

널리 알려짐

당신의 삶을 더 쉽게 만들어 줄 인공 지능 도구를 찾고 계십니까? 이 가이드에서는에서 AI 기반 로봇 카탈로그를 탐색하고 해당 기능에 대해 알아봅니다. 우리 기자단이 내린 평가를 확인해보세요!

스크롤