Google SoundStorm：用於高效能音訊產生的人工智慧

通過尤斯利·杜拉斯 / 30/05/2023 / 1分鐘閱讀

O Google 推出了 SoundStorm，這是一項用於高效生成音訊的人工智慧創新。

SoundStorm 可以合成不同聲音的對話並開啟新的可能性，例如從文字和逼真的播客創建音訊內容。
與其前身不同，SoundStorm 以 30 秒的區塊生成音頻，從而提高了效率。
他是訓練有素的擁有大量對話資料集，確保對口語的深入理解。
SoundStorm 的速度是先前型號的兩倍，只需 30 秒即可產生 0,5 秒的音訊。
該工具尚未普及到公眾，但是研究展示了人工智慧應該如何運作。
SoundStorm 產生的音訊與先前的模型具有相同的質量，並且準確地保留了說話者的聲音。
重要的是要考慮可能的道德問題，例如與口音相關的偏見和模仿聲音的濫用。
O Google 強調了實施保護措施的重要性，並研究了檢測該技術的道德使用的方法，例如音訊浮水印。
聽一下由 SoundStorm 產生的英文音訊範例：

另見：

洪水中心：預測巴西洪水的人工智慧

Captura-de-Tela-2023-05-29-as-18.31.27-aspect-ratio-930-440

據估計，洪水每年影響全球超過 250 億人，造成約 10 億美元的經濟影響。考慮緩解這個問題 Google 正在擴展基於人工智慧 (AI) 的洪水預報數位工具：洪水中心。

關於作者

尤斯利·杜拉斯