Maaaring hulaan ng modelo ng AI ang mga emosyon sa pamamagitan ng pagsusuri sa ating tono ng boses

Sinasagot ng isang groundbreaking na pag-aaral ng mga mananaliksik na Aleman ang tanong na iyon nang may matunog na "oo." Gamit ang tatlong modelo ng machine learning, tumpak na nakilala ng mga siyentipiko ang iba't ibang emosyon sa mga audio sample sa loob lamang ng 1,5 segundo.

ADVERTISING

Ang Paglalakbay upang Matuklasan ang mga Lihim ng Tinig

Nai-publish sa journal Frontiers in Psychology, sinuri ng pag-aaral ang mga walang katuturang pangungusap na kinuha mula sa dalawang dataset: isang Canadian at isang German. Inalis ng estratehikong pagpipiliang ito ang impluwensya ng mga nuances ng wika at kultura, na nakatuon lamang sa tono ng boses.

Ang bawat audio clip ay maingat na pinutol sa 1,5 segundo, ang pinakamababang haba na kailangan para sa mga tao upang matukoy ang mga emosyon sa pagsasalita. Tinitiyak ng temporal na katumpakan na ito na ang bawat fragment ay kumakatawan sa iisang damdamin, na iniiwasan ang mga overlap at ambiguity.

Mga Emosyon na Nakatuon

Nakatuon ang pag-aaral sa anim na pangunahing emosyon: kagalakan, raiva, kalungkutan, takot, pagkasuklam at neutralidad. Sa pamamagitan ng mga teknik ng machine learning, ang mga modelo ay sinanay upang makilala ang mga tiyak na pattern ng tunog na nauugnay sa bawat emosyonal na estado.

ADVERTISING

Tatlong Modelo, Tatlong Diskarte

Upang matuklasan ang mga lihim ng boses, gumamit ang mga mananaliksik ng tatlong magkakaibang modelo ng boses. machine learning:

Mga Deep Neural Network (DNN): Gumagana ang mga ito tulad ng mga kumplikadong filter, sinusuri ang mga bahagi ng tunog tulad ng dalas at tono. Halimbawa, ang mataas na tono ng boses ay maaaring magpahiwatig ng raiva o pagkabigo.
Convolutional Neural Networks (CNNs): Naghahanap sila ng mga visual na pattern sa mga graphic na representasyon ng mga sound wave, katulad ng paraan ng pagtukoy natin ng mga emosyon sa ritmo at texture ng boses.
Hybrid Model (C-DNN): Pinagsasama nito ang dalawang nakaraang diskarte, gamit ang parehong audio at visual na representasyon nito upang makakuha ng mas tumpak na hula ng mga emosyon.

Mga Pangangakong Resulta at Hamon na Malalampasan

Ang mga resulta ng pag-aaral ay nakapagpapatibay. Ang mga modelo ng machine learning Nagawa nilang tukuyin ang mga emosyon na may katumpakan na katulad ng sa mga tao, kahit na sa mga walang kabuluhang pangungusap na walang konteksto.

Gayunpaman, kinikilala ng mga may-akda ang ilang mga limitasyon. Maaaring hindi makuha ng mga maikling pangungusap na ginamit ang buong hanay ng mga nuances at kalabuan na nasa totoong emosyon. Higit pa rito, kailangan ang pananaliksik sa hinaharap upang matukoy ang pinakamainam na tagal ng audio para sa tumpak na pagkilala sa emosyon.

ADVERTISING

Ang Kinabukasan ng Human-Machine Interaction

Ang kakayahang kilalanin ang mga emosyon sa pamamagitan ng boses ay nagbubukas ng isang hanay ng mga posibilidad para sa hinaharap ng pakikipag-ugnayan ng tao-machine. Isipin ang isang hinaharap kung saan ang mga smart device at virtual assistant ay makakaunawa at makakatugon sa iyong mga emosyonal na pangangailangan.

Ang pag-aaral na ito ay kumakatawan sa isang mahalagang hakbang sa direksyong ito, na nagpapakita ng potensyal ng inteligência artipisyal upang i-decode ang mga lihim ng boses ng tao at lumikha ng higit na nakikiramay at makatao na mga interface.

Basahin din:

Ang bagong paraan ay bumubuo ng mga imahe ng AI nang 30x na mas mabilis

Ipinakilala ng mga mananaliksik sa Massachusetts Institute of Technology (MIT) ang isang bagong paraan na tinatawag na 'Distribution Matching Distillation' – nagpapagana ng mas mabilis na henerasyon ng mga imahe ng artificial intelligence (AI) habang pinapanatili ang kalidad ng orihinal na modelo.

* Ang teksto ng artikulong ito ay bahagyang nabuo ng mga tool ng artificial intelligence, mga makabagong modelo ng wika na tumutulong sa paghahanda, pagsusuri, pagsasalin at pagbubuod ng mga teksto. Ang mga text entry ay nilikha ng Curto Ang mga balita at tugon mula sa mga tool ng AI ay ginamit upang pahusayin ang panghuling nilalaman.
Mahalagang i-highlight na ang mga tool ng AI ay mga tool lamang, at ang huling responsibilidad para sa na-publish na nilalaman ay nakasalalay sa Curto Balita. Sa pamamagitan ng paggamit ng mga tool na ito nang responsable at etikal, ang aming layunin ay palawakin ang mga posibilidad sa komunikasyon at gawing demokrasya ang pag-access sa de-kalidad na impormasyon. 🤖

ADVERTISING

Naghahanap ng tool na Artificial Intelligence para gawing mas madali ang iyong buhay? Sa gabay na ito, nagba-browse ka ng catalog ng mga robot na pinapagana ng AI at alamin ang tungkol sa kanilang mga functionality. Tingnan ang pagsusuri na ibinigay sa kanila ng aming pangkat ng mga mamamahayag!