AI մոդելը կարող է կռահել զգացմունքները՝ վերլուծելով մեր ձայնի տոնը

Գերմանացի հետազոտողների կողմից կատարված բեկումնային հետազոտությունը պատասխանում է այդ հարցին վճռական «այո»-ով։ Օգտագործելով երեք մոդելներ Machine Learning, գիտնականները կարողացել են ճշգրիտ ճանաչել տարբեր հույզեր ձայնային նմուշներում ընդամենը 1,5 վայրկյանում։

ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ

Ձայնի գաղտնիքները բացահայտելու ճանապարհորդություն

Հրատարակված է Frontiers in Psychology ամսագրում, Հետազոտությունը վերլուծել է անհեթեթ նախադասություններ՝ քաղված երկու տվյալների հավաքածուից՝ մեկ կանադական և մեկ գերմանական: Այս ռազմավարական ընտրությունը վերացրեց լեզվի և մշակութային նրբերանգների ազդեցությունը՝ կենտրոնանալով բացառապես ձայնի տոնայնության վրա:

Յուրաքանչյուր աուդիո հոլովակ խնամքով կրճատվել է մինչև 1,5 վայրկյան, ինչը մարդկանց համար անհրաժեշտ նվազագույն երկարություն է՝ խոսքի մեջ զգացմունքները բացահայտելու համար: Այս ժամանակային ճշգրտությունը երաշխավորում է, որ յուրաքանչյուր հատվածը ներկայացնում է մեկ զգացմունք՝ խուսափելով համընկնումներից և երկիմաստություններից:

Զգացմունքները ուշադրության կենտրոնում

Ուսումնասիրությունը կենտրոնացել է վեց հիմնական հույզերի վրա՝ ուրախություն, ռaiva, տխրություն, վախ, զզվանք և չեզոքություն։ տեխնիկայի միջոցով Machine Learning, մոդելները սովորել են ճանաչել ձայնային հատուկ օրինաչափությունները՝ կապված յուրաքանչյուր հուզական վիճակի հետ:

ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ

Երեք մոդել, երեք մոտեցում

Ձայնի գաղտնիքները բացահայտելու համար հետազոտողները օգտագործել են երեք տարբեր ձայնային մոդելներ: Machine Learning:

Խորը նյարդային ցանցեր (DNN): Նրանք աշխատում են բարդ զտիչների պես՝ վերլուծելով ձայնային բաղադրիչները, ինչպիսիք են հաճախականությունը և տոնայնությունը: Օրինակ, ձայնի բարձրացված տոնը կարող է ցույց տալ raiva կամ հիասթափություն:
Convolutional Neural Networks (CNN): Նրանք ձայնային ալիքների գրաֆիկական ներկայացման մեջ փնտրում են վիզուալ նախշեր, որոնք նման են այն բանին, թե ինչպես ենք մենք նույնացնում զգացմունքները ձայնի ռիթմի և հյուսվածքի մեջ:
Հիբրիդային մոդել (C-DNN): Այն համատեղում է երկու նախորդ տեխնիկան՝ օգտագործելով ինչպես աուդիո, այնպես էլ դրա վիզուալ ներկայացումը զգացմունքների ավելի ճշգրիտ կանխատեսում ստանալու համար:

Խոստումնալից արդյունքներ և մարտահրավերներ, որոնք պետք է հաղթահարել

Հետազոտության արդյունքները հուսադրող էին. -ի մոդելները Machine Learning Նրանք կարողացան նույնականացնել զգացմունքները այնպիսի ճշգրտությամբ, ինչպիսին է մարդկանց, նույնիսկ անիմաստ նախադասություններում, որոնք զուրկ են համատեքստից:

Այնուամենայնիվ, հեղինակները ճանաչում են որոշ սահմանափակումներ. Օգտագործված կարճ նախադասությունները չեն կարող ընդգրկել իրական զգացմունքներում առկա նրբությունների և երկիմաստությունների ամբողջ շրջանակը: Ավելին, անհրաժեշտ է ապագա հետազոտություն՝ էմոցիաների ճշգրիտ ճանաչման համար ձայնի օպտիմալ տեւողությունը որոշելու համար:

ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ

Մարդ-մեքենա փոխազդեցության ապագան

Զգացմունքները ձայնի միջոցով ճանաչելու կարողությունը մի շարք հնարավորություններ է բացում մարդ-մեքենա փոխգործակցության ապագայի համար: Պատկերացրեք ապագա, որտեղ խելացի սարքերը և վիրտուալ օգնականները կարող են հասկանալ և պատասխանել ձեր հուզական կարիքներին:

Այս ուսումնասիրությունը կարևոր քայլ է այս ուղղությամբ՝ ցուցադրելով ներուժը արհեստական ինտելեկտուալություն վերծանել մարդկային ձայնի գաղտնիքները և ստեղծել ավելի կարեկից և մարդասիրական միջերեսներ:

Կարդացեք նաեւ.

Նոր մեթոդը 30 անգամ ավելի արագ է ստեղծում AI պատկերներ

Մասաչուսեթսի տեխնոլոգիական ինստիտուտի (MIT) հետազոտողները նոր մեթոդ են ներկայացրել, որը կոչվում է «Distribution Matching Distillation», որը թույլ է տալիս ավելի արագ արտադրել արհեստական ինտելեկտի (AI) պատկերներ՝ միաժամանակ պահպանելով սկզբնական մոդելի որակը:

* Այս հոդվածի տեքստը մասամբ ստեղծվել է արհեստական ինտելեկտի գործիքների, ժամանակակից լեզվական մոդելների միջոցով, որոնք օգնում են տեքստերի պատրաստմանը, վերանայմանը, թարգմանությանը և ամփոփմանը: Տեքստային մուտքերը ստեղծվել են Curto Վերջնական բովանդակությունը բարելավելու համար օգտագործվել են AI գործիքների նորությունները և պատասխանները:
Կարևոր է ընդգծել, որ AI գործիքները պարզապես գործիքներ են, և հրապարակված բովանդակության վերջնական պատասխանատվությունը կրում է Curto Նորություններ. Այս գործիքները պատասխանատու և էթիկորեն օգտագործելով՝ մեր նպատակն է ընդլայնել հաղորդակցման հնարավորությունները և ժողովրդավարացնել որակյալ տեղեկատվության հասանելիությունը: 🤖

ՀՐԱՊԱՐԱԿԱԿԱՆՈՒԹՅՈՒՆ

Փնտրու՞մ եք արհեստական ինտելեկտի գործիք՝ ձեր կյանքը հեշտացնելու համար: Այս ուղեցույցում, դուք թերթում եք AI-ով աշխատող ռոբոտների կատալոգը և ծանոթանում դրանց ֆունկցիոնալությանը: Ստուգե՛ք այն գնահատականը, որը նրանց տվել է մեր լրագրողների թիմը:

AI մոդելը կարող է կռահել զգացմունքները՝ վերլուծելով մեր ձայնի տոնը

Ձայնի գաղտնիքները բացահայտելու ճանապարհորդություն

Զգացմունքները ուշադրության կենտրոնում

Երեք մոդել, երեք մոտեցում

Խոստումնալից արդյունքներ և մարտահրավերներ, որոնք պետք է հաղթահարել

Մարդ-մեքենա փոխազդեցության ապագան

Գրողի մասին

Իզաբելլա Կամինոտո

Ձայնի գաղտնիքները բացահայտելու ճանապարհորդություն

Զգացմունքները ուշադրության կենտրոնում

Երեք մոդել, երեք մոտեցում

Խոստումնալից արդյունքներ և մարտահրավերներ, որոնք պետք է հաղթահարել

Մարդ-մեքենա փոխազդեցության ապագան

Գրողի մասին

Իզաբելլա Կամինոտո

ամենաընթերցվածները

Հարաբերություններ