एआई मॉडल हमारी आवाज के स्वर का विश्लेषण करके भावनाओं का अनुमान लगा सकता है

जर्मन शोधकर्ताओं द्वारा किया गया एक अभूतपूर्व अध्ययन उस प्रश्न का उत्तर जोरदार "हाँ" में देता है। के तीन मॉडलों का उपयोग करना यंत्र अधिगमवैज्ञानिक मात्र 1,5 सेकंड के ऑडियो नमूनों में विभिन्न भावनाओं को सटीक रूप से पहचानने में सक्षम थे।

प्रचार

आवाज के रहस्यों को उजागर करने की यात्रा

फ्रंटियर्स इन साइकोलॉजी पत्रिका में प्रकाशित, अध्ययन में दो डेटासेट से निकाले गए बकवास वाक्यों का विश्लेषण किया गया: एक कनाडाई और एक जर्मन। इस रणनीतिक विकल्प ने भाषा और सांस्कृतिक बारीकियों के प्रभाव को समाप्त कर दिया, केवल आवाज के लहजे पर ध्यान केंद्रित किया।

प्रत्येक ऑडियो क्लिप को सावधानीपूर्वक 1,5 सेकंड तक छोटा किया गया था, जो मनुष्यों के लिए भाषण में भावनाओं की पहचान करने के लिए आवश्यक न्यूनतम लंबाई थी। यह अस्थायी परिशुद्धता सुनिश्चित करती है कि प्रत्येक टुकड़ा एक ही भावना का प्रतिनिधित्व करता है, ओवरलैप और अस्पष्टताओं से बचता है।

फोकस में भावनाएं

अध्ययन छह बुनियादी भावनाओं पर केंद्रित है: खुशी, आरaiva, उदासी, भय, घृणा और तटस्थता। की तकनीकों के माध्यम से यंत्र अधिगम, मॉडलों को प्रत्येक भावनात्मक स्थिति से जुड़े विशिष्ट ध्वनि पैटर्न को पहचानने के लिए प्रशिक्षित किया गया था।

प्रचार

तीन मॉडल, तीन दृष्टिकोण

आवाज के रहस्यों को उजागर करने के लिए शोधकर्ताओं ने तीन अलग-अलग आवाज मॉडल का इस्तेमाल किया। यंत्र अधिगम:

डीप न्यूरल नेटवर्क (डीएनएन): वे जटिल फिल्टर की तरह काम करते हैं, आवृत्ति और टोन जैसे ध्वनि घटकों का विश्लेषण करते हैं। उदाहरण के लिए, आवाज का ऊंचा स्वर आर का संकेत दे सकता हैaiva या हताशा.
कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन): वे ध्वनि तरंगों के ग्राफिक निरूपण में दृश्य पैटर्न की तलाश करते हैं, ठीक उसी तरह जैसे हम आवाज की लय और बनावट में भावनाओं की पहचान करते हैं।
हाइब्रिड मॉडल (सी-डीएनएन): यह भावनाओं की अधिक सटीक भविष्यवाणी प्राप्त करने के लिए ऑडियो और इसके दृश्य प्रतिनिधित्व दोनों का उपयोग करके पिछली दो तकनीकों को जोड़ती है।

आशाजनक परिणाम और चुनौतियों पर काबू पाना

अध्ययन के नतीजे उत्साहवर्धक थे. के मॉडल यंत्र अधिगम वे संदर्भ से रहित अर्थहीन वाक्यों में भी, मनुष्यों के समान सटीकता के साथ भावनाओं को पहचानने में सक्षम थे।

हालाँकि, लेखक कुछ सीमाओं को पहचानते हैं। इस्तेमाल किए गए छोटे वाक्य वास्तविक भावनाओं में मौजूद बारीकियों और अस्पष्टताओं की पूरी श्रृंखला को पकड़ नहीं सकते हैं। इसके अलावा, सटीक भावना पहचान के लिए इष्टतम ऑडियो अवधि निर्धारित करने के लिए भविष्य के शोध की आवश्यकता है।

प्रचार

मानव-मशीन संपर्क का भविष्य

आवाज के माध्यम से भावनाओं को पहचानने की क्षमता मानव-मशीन संपर्क के भविष्य के लिए संभावनाओं की एक श्रृंखला खोलती है। एक ऐसे भविष्य की कल्पना करें जहां स्मार्ट डिवाइस और वर्चुअल असिस्टेंट आपकी भावनात्मक जरूरतों को समझ सकें और उनका जवाब दे सकें।

यह अध्ययन इस दिशा में एक महत्वपूर्ण कदम दर्शाता है, जिसकी क्षमता प्रदर्शित होती है कृत्रिम बुद्धि मानव आवाज़ के रहस्यों को समझना और अधिक सहानुभूतिपूर्ण और मानवीय इंटरफ़ेस बनाना।

यह भी पढ़ें:

नई विधि एआई छवियां 30 गुना तेजी से उत्पन्न करती है

मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (एमआईटी) के शोधकर्ताओं ने हाल ही में 'डिस्ट्रीब्यूशन मैचिंग डिस्टिलेशन' नामक एक नई विधि पेश की है - जो मूल मॉडल की गुणवत्ता को बनाए रखते हुए कृत्रिम बुद्धिमत्ता (एआई) छवियों को तेजी से उत्पन्न करने में सक्षम बनाती है।

* इस लेख का पाठ आंशिक रूप से कृत्रिम बुद्धिमत्ता उपकरण, अत्याधुनिक भाषा मॉडल द्वारा तैयार किया गया था जो पाठ की तैयारी, समीक्षा, अनुवाद और सारांश में सहायता करते हैं। पाठ प्रविष्टियाँ किसके द्वारा बनाई गई थीं? Curto अंतिम सामग्री को बेहतर बनाने के लिए एआई टूल से समाचार और प्रतिक्रियाओं का उपयोग किया गया।
यह उजागर करना महत्वपूर्ण है कि एआई उपकरण सिर्फ उपकरण हैं, और प्रकाशित सामग्री की अंतिम जिम्मेदारी उसी की है Curto समाचार। इन उपकरणों का जिम्मेदारीपूर्वक और नैतिक रूप से उपयोग करके, हमारा उद्देश्य संचार संभावनाओं का विस्तार करना और गुणवत्तापूर्ण जानकारी तक पहुंच को लोकतांत्रिक बनाना है। 🤖

प्रचार

क्या आप अपने जीवन को आसान बनाने के लिए किसी आर्टिफिशियल इंटेलिजेंस टूल की तलाश कर रहे हैं? इस गाइड में, आप एआई-संचालित रोबोटों की एक सूची ब्राउज़ करें और उनकी कार्यक्षमता के बारे में जानें। हमारे पत्रकारों की टीम ने उन्हें जो मूल्यांकन दिया, उसे देखें!

एआई मॉडल हमारी आवाज के स्वर का विश्लेषण करके भावनाओं का अनुमान लगा सकता है

आवाज के रहस्यों को उजागर करने की यात्रा

फोकस में भावनाएं

तीन मॉडल, तीन दृष्टिकोण

आशाजनक परिणाम और चुनौतियों पर काबू पाना

मानव-मशीन संपर्क का भविष्य

लेखक के बारे में

इसाबेला कैमिनोटो

आवाज के रहस्यों को उजागर करने की यात्रा

फोकस में भावनाएं

तीन मॉडल, तीन दृष्टिकोण

आशाजनक परिणाम और चुनौतियों पर काबू पाना

मानव-मशीन संपर्क का भविष्य

लेखक के बारे में

इसाबेला कैमिनोटो

माईस लिडास

सम्बंधित