Google साउंडस्टॉर्म: कुशल ऑडियो पीढ़ी के लिए कृत्रिम बुद्धिमत्ता

साउंडस्टॉर्म विभिन्न आवाजों के साथ संवादों को संश्लेषित कर सकता है और नई संभावनाओं को खोल सकता है, जैसे टेक्स्ट और यथार्थवादी पॉडकास्ट से ऑडियो सामग्री बनाना।
अपने पूर्ववर्ती के विपरीत, साउंडस्टॉर्म 30-सेकंड के टुकड़ों में ऑडियो उत्पन्न करता है, जिससे दक्षता बढ़ जाती है।
एले फोई प्रशिक्षित संवादों के एक बड़े डेटासेट के साथ, बोली जाने वाली भाषा की मजबूत समझ सुनिश्चित करना।
साउंडस्टॉर्म पिछले मॉडल से दोगुना तेज़ है, जो केवल 30 सेकंड में 0,5 सेकंड का ऑडियो जेनरेट करने में सक्षम है।
यह उपकरण अभी तक आम जनता तक नहीं पहुंचा है अनुसंधान प्रस्तुत किया गया कि एआई को कैसे काम करना चाहिए।
साउंडस्टॉर्म द्वारा उत्पन्न ऑडियो पिछले मॉडल के बराबर गुणवत्ता का है और स्पीकर की आवाज़ को सटीक रूप से संरक्षित करता है।
संभावित नैतिक समस्याओं पर विचार करना महत्वपूर्ण है, जैसे कि उच्चारण से संबंधित पूर्वाग्रह और आवाजों की नकल में दुर्व्यवहार।
O Google सुरक्षा लागू करने के महत्व पर प्रकाश डालता है और ऑडियो वॉटरमार्किंग जैसी इस तकनीक के नैतिक उपयोग का पता लगाने के तरीकों का अध्ययन करता है।
साउंडस्टॉर्म द्वारा उत्पन्न ऑडियो का एक उदाहरण अंग्रेजी में सुनें: