- साउंडस्टॉर्म विभिन्न आवाजों के साथ संवादों को संश्लेषित कर सकता है और नई संभावनाओं को खोल सकता है, जैसे टेक्स्ट और यथार्थवादी पॉडकास्ट से ऑडियो सामग्री बनाना।
- अपने पूर्ववर्ती के विपरीत, साउंडस्टॉर्म 30-सेकंड के टुकड़ों में ऑडियो उत्पन्न करता है, जिससे दक्षता बढ़ जाती है।
- एले फोई प्रशिक्षित संवादों के एक बड़े डेटासेट के साथ, बोली जाने वाली भाषा की मजबूत समझ सुनिश्चित करना।
- साउंडस्टॉर्म पिछले मॉडल से दोगुना तेज़ है, जो केवल 30 सेकंड में 0,5 सेकंड का ऑडियो जेनरेट करने में सक्षम है।
- यह उपकरण अभी तक आम जनता तक नहीं पहुंचा है अनुसंधान प्रस्तुत किया गया कि एआई को कैसे काम करना चाहिए।
- साउंडस्टॉर्म द्वारा उत्पन्न ऑडियो पिछले मॉडल के बराबर गुणवत्ता का है और स्पीकर की आवाज़ को सटीक रूप से संरक्षित करता है।
- संभावित नैतिक समस्याओं पर विचार करना महत्वपूर्ण है, जैसे कि उच्चारण से संबंधित पूर्वाग्रह और आवाजों की नकल में दुर्व्यवहार।
- O Google सुरक्षा लागू करने के महत्व पर प्रकाश डालता है और ऑडियो वॉटरमार्किंग जैसी इस तकनीक के नैतिक उपयोग का पता लगाने के तरीकों का अध्ययन करता है।
- साउंडस्टॉर्म द्वारा उत्पन्न ऑडियो का एक उदाहरण अंग्रेजी में सुनें:
यह भी देखें: