Գերմանացի հետազոտողների կողմից կատարված բեկումնային հետազոտությունը պատասխանում է այդ հարցին վճռական «այո»-ով։ Օգտագործելով երեք մոդելներ Machine Learning, գիտնականները կարողացել են ճշգրիտ ճանաչել տարբեր հույզեր ձայնային նմուշներում ընդամենը 1,5 վայրկյանում։
ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ
Ձայնի գաղտնիքները բացահայտելու ճանապարհորդություն
Հրատարակված է Frontiers in Psychology ամսագրում, Հետազոտությունը վերլուծել է անհեթեթ նախադասություններ՝ քաղված երկու տվյալների հավաքածուից՝ մեկ կանադական և մեկ գերմանական: Այս ռազմավարական ընտրությունը վերացրեց լեզվի և մշակութային նրբերանգների ազդեցությունը՝ կենտրոնանալով բացառապես ձայնի տոնայնության վրա:
Յուրաքանչյուր աուդիո հոլովակ խնամքով կրճատվել է մինչև 1,5 վայրկյան, ինչը մարդկանց համար անհրաժեշտ նվազագույն երկարություն է՝ խոսքի մեջ զգացմունքները բացահայտելու համար: Այս ժամանակային ճշգրտությունը երաշխավորում է, որ յուրաքանչյուր հատվածը ներկայացնում է մեկ զգացմունք՝ խուսափելով համընկնումներից և երկիմաստություններից:
Զգացմունքները ուշադրության կենտրոնում
Ուսումնասիրությունը կենտրոնացել է վեց հիմնական հույզերի վրա՝ ուրախություն, ռaiva, տխրություն, վախ, զզվանք և չեզոքություն։ տեխնիկայի միջոցով Machine Learning, մոդելները սովորել են ճանաչել ձայնային հատուկ օրինաչափությունները՝ կապված յուրաքանչյուր հուզական վիճակի հետ:
ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ
Երեք մոդել, երեք մոտեցում
Ձայնի գաղտնիքները բացահայտելու համար հետազոտողները օգտագործել են երեք տարբեր ձայնային մոդելներ: Machine Learning:
- Խորը նյարդային ցանցեր (DNN): Նրանք աշխատում են բարդ զտիչների պես՝ վերլուծելով ձայնային բաղադրիչները, ինչպիսիք են հաճախականությունը և տոնայնությունը: Օրինակ, ձայնի բարձրացված տոնը կարող է ցույց տալ raiva կամ հիասթափություն:
- Convolutional Neural Networks (CNN): Նրանք ձայնային ալիքների գրաֆիկական ներկայացման մեջ փնտրում են վիզուալ նախշեր, որոնք նման են այն բանին, թե ինչպես ենք մենք նույնացնում զգացմունքները ձայնի ռիթմի և հյուսվածքի մեջ:
- Հիբրիդային մոդել (C-DNN): Այն համատեղում է երկու նախորդ տեխնիկան՝ օգտագործելով ինչպես աուդիո, այնպես էլ դրա վիզուալ ներկայացումը զգացմունքների ավելի ճշգրիտ կանխատեսում ստանալու համար:
Խոստումնալից արդյունքներ և մարտահրավերներ, որոնք պետք է հաղթահարել
Հետազոտության արդյունքները հուսադրող էին. -ի մոդելները Machine Learning Նրանք կարողացան նույնականացնել զգացմունքները այնպիսի ճշգրտությամբ, ինչպիսին է մարդկանց, նույնիսկ անիմաստ նախադասություններում, որոնք զուրկ են համատեքստից:
Այնուամենայնիվ, հեղինակները ճանաչում են որոշ սահմանափակումներ. Օգտագործված կարճ նախադասությունները չեն կարող ընդգրկել իրական զգացմունքներում առկա նրբությունների և երկիմաստությունների ամբողջ շրջանակը: Ավելին, անհրաժեշտ է ապագա հետազոտություն՝ էմոցիաների ճշգրիտ ճանաչման համար ձայնի օպտիմալ տեւողությունը որոշելու համար:
ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ
Մարդ-մեքենա փոխազդեցության ապագան
Զգացմունքները ձայնի միջոցով ճանաչելու կարողությունը մի շարք հնարավորություններ է բացում մարդ-մեքենա փոխգործակցության ապագայի համար: Պատկերացրեք ապագա, որտեղ խելացի սարքերը և վիրտուալ օգնականները կարող են հասկանալ և պատասխանել ձեր հուզական կարիքներին:
Այս ուսումնասիրությունը կարևոր քայլ է այս ուղղությամբ՝ ցուցադրելով ներուժը արհեստական ինտելեկտուալություն վերծանել մարդկային ձայնի գաղտնիքները և ստեղծել ավելի կարեկից և մարդասիրական միջերեսներ:
Կարդացեք նաեւ.
* Այս հոդվածի տեքստը մասամբ ստեղծվել է արհեստական ինտելեկտի գործիքների, ժամանակակից լեզվական մոդելների միջոցով, որոնք օգնում են տեքստերի պատրաստմանը, վերանայմանը, թարգմանությանը և ամփոփմանը: Տեքստային մուտքերը ստեղծվել են Curto Վերջնական բովանդակությունը բարելավելու համար օգտագործվել են AI գործիքների նորությունները և պատասխանները:
Կարևոր է ընդգծել, որ AI գործիքները պարզապես գործիքներ են, և հրապարակված բովանդակության վերջնական պատասխանատվությունը կրում է Curto Նորություններ. Այս գործիքները պատասխանատու և էթիկորեն օգտագործելով՝ մեր նպատակն է ընդլայնել հաղորդակցման հնարավորությունները և ժողովրդավարացնել որակյալ տեղեկատվության հասանելիությունը: 🤖
ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ
Փնտրու՞մ եք արհեստական ինտելեկտի գործիք՝ ձեր կյանքը հեշտացնելու համար: Այս ուղեցույցում, դուք թերթում եք AI-ով աշխատող ռոբոտների կատալոգը և ծանոթանում դրանց ֆունկցիոնալությանը: Ստուգե՛ք այն գնահատականը, որը նրանց տվել է մեր լրագրողների թիմը: