एआई मॉडल हमारी आवाज के स्वर का विश्लेषण करके भावनाओं का अनुमान लगा सकता है
छवि क्रेडिट: Curto न्यूज/बिंग एआई

एआई मॉडल हमारी आवाज के स्वर का विश्लेषण करके भावनाओं का अनुमान लगा सकता है

आवाज केवल संचार के साधन से कहीं अधिक है। यह हमारी सबसे अंतरंग भावनाओं को प्रकट करने वाला माध्यम है। यदि आवाज के स्वर को समझना हम इंसानों के लिए स्वाभाविक है, तो क्या कृत्रिम बुद्धिमत्ता (एआई) भी ऐसा कर सकती है?

जर्मन शोधकर्ताओं द्वारा किया गया एक अभूतपूर्व अध्ययन उस प्रश्न का उत्तर जोरदार "हाँ" में देता है। के तीन मॉडलों का उपयोग करना यंत्र अधिगमवैज्ञानिक मात्र 1,5 सेकंड के ऑडियो नमूनों में विभिन्न भावनाओं को सटीक रूप से पहचानने में सक्षम थे।

प्रचार

आवाज के रहस्यों को उजागर करने की यात्रा

फ्रंटियर्स इन साइकोलॉजी पत्रिका में प्रकाशित, अध्ययन में दो डेटासेट से निकाले गए बकवास वाक्यों का विश्लेषण किया गया: एक कनाडाई और एक जर्मन। इस रणनीतिक विकल्प ने भाषा और सांस्कृतिक बारीकियों के प्रभाव को समाप्त कर दिया, केवल आवाज के लहजे पर ध्यान केंद्रित किया।

प्रत्येक ऑडियो क्लिप को सावधानीपूर्वक 1,5 सेकंड तक छोटा किया गया था, जो मनुष्यों के लिए भाषण में भावनाओं की पहचान करने के लिए आवश्यक न्यूनतम लंबाई थी। यह अस्थायी परिशुद्धता सुनिश्चित करती है कि प्रत्येक टुकड़ा एक ही भावना का प्रतिनिधित्व करता है, ओवरलैप और अस्पष्टताओं से बचता है।

फोकस में भावनाएं

अध्ययन छह बुनियादी भावनाओं पर केंद्रित है: खुशी, आरaiva, उदासी, भय, घृणा और तटस्थता। की तकनीकों के माध्यम से यंत्र अधिगम, मॉडलों को प्रत्येक भावनात्मक स्थिति से जुड़े विशिष्ट ध्वनि पैटर्न को पहचानने के लिए प्रशिक्षित किया गया था।

प्रचार

तीन मॉडल, तीन दृष्टिकोण

आवाज के रहस्यों को उजागर करने के लिए शोधकर्ताओं ने तीन अलग-अलग आवाज मॉडल का इस्तेमाल किया। यंत्र अधिगम:

  • डीप न्यूरल नेटवर्क (डीएनएन): वे जटिल फिल्टर की तरह काम करते हैं, आवृत्ति और टोन जैसे ध्वनि घटकों का विश्लेषण करते हैं। उदाहरण के लिए, आवाज का ऊंचा स्वर आर का संकेत दे सकता हैaiva या हताशा.
  • कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन): वे ध्वनि तरंगों के ग्राफिक निरूपण में दृश्य पैटर्न की तलाश करते हैं, ठीक उसी तरह जैसे हम आवाज की लय और बनावट में भावनाओं की पहचान करते हैं।
  • हाइब्रिड मॉडल (सी-डीएनएन): यह भावनाओं की अधिक सटीक भविष्यवाणी प्राप्त करने के लिए ऑडियो और इसके दृश्य प्रतिनिधित्व दोनों का उपयोग करके पिछली दो तकनीकों को जोड़ती है।

आशाजनक परिणाम और चुनौतियों पर काबू पाना

अध्ययन के नतीजे उत्साहवर्धक थे. के मॉडल यंत्र अधिगम वे संदर्भ से रहित अर्थहीन वाक्यों में भी, मनुष्यों के समान सटीकता के साथ भावनाओं को पहचानने में सक्षम थे।

हालाँकि, लेखक कुछ सीमाओं को पहचानते हैं। इस्तेमाल किए गए छोटे वाक्य वास्तविक भावनाओं में मौजूद बारीकियों और अस्पष्टताओं की पूरी श्रृंखला को पकड़ नहीं सकते हैं। इसके अलावा, सटीक भावना पहचान के लिए इष्टतम ऑडियो अवधि निर्धारित करने के लिए भविष्य के शोध की आवश्यकता है।

प्रचार

मानव-मशीन संपर्क का भविष्य

आवाज के माध्यम से भावनाओं को पहचानने की क्षमता मानव-मशीन संपर्क के भविष्य के लिए संभावनाओं की एक श्रृंखला खोलती है। एक ऐसे भविष्य की कल्पना करें जहां स्मार्ट डिवाइस और वर्चुअल असिस्टेंट आपकी भावनात्मक जरूरतों को समझ सकें और उनका जवाब दे सकें।

यह अध्ययन इस दिशा में एक महत्वपूर्ण कदम दर्शाता है, जिसकी क्षमता प्रदर्शित होती है कृत्रिम बुद्धि मानव आवाज़ के रहस्यों को समझना और अधिक सहानुभूतिपूर्ण और मानवीय इंटरफ़ेस बनाना।

यह भी पढ़ें:

* इस लेख का पाठ आंशिक रूप से कृत्रिम बुद्धिमत्ता उपकरण, अत्याधुनिक भाषा मॉडल द्वारा तैयार किया गया था जो पाठ की तैयारी, समीक्षा, अनुवाद और सारांश में सहायता करते हैं। पाठ प्रविष्टियाँ किसके द्वारा बनाई गई थीं? Curto अंतिम सामग्री को बेहतर बनाने के लिए एआई टूल से समाचार और प्रतिक्रियाओं का उपयोग किया गया।
यह उजागर करना महत्वपूर्ण है कि एआई उपकरण सिर्फ उपकरण हैं, और प्रकाशित सामग्री की अंतिम जिम्मेदारी उसी की है Curto समाचार। इन उपकरणों का जिम्मेदारीपूर्वक और नैतिक रूप से उपयोग करके, हमारा उद्देश्य संचार संभावनाओं का विस्तार करना और गुणवत्तापूर्ण जानकारी तक पहुंच को लोकतांत्रिक बनाना है।
🤖

प्रचार

क्या आप अपने जीवन को आसान बनाने के लिए किसी आर्टिफिशियल इंटेलिजेंस टूल की तलाश कर रहे हैं? इस गाइड में, आप एआई-संचालित रोबोटों की एक सूची ब्राउज़ करें और उनकी कार्यक्षमता के बारे में जानें। हमारे पत्रकारों की टीम ने उन्हें जो मूल्यांकन दिया, उसे देखें!

ऊपर स्क्रॉल करें