Google SoundStorm:用於高效能音訊產生的人工智慧

O Google 推出了 SoundStorm,這是一項用於高效生成音訊的人工智慧創新。

  • SoundStorm 可以合成不同聲音的對話並開啟新的可能性,例如從文字和逼真的播客創建音訊內容。
  • 與其前身不同,SoundStorm 以 30 秒的區塊生成音頻,從而提高了效率。
  • 他是 訓練有素的 擁有大量對話資料集,確保對口語的深入理解。
  • SoundStorm 的速度是先前型號的兩倍,只需 30 秒即可產生 0,5 秒的音訊。
  • 該工具尚未普及到公眾,但是 研究 展示了人工智慧應該如何運作。
  • SoundStorm 產生的音訊與先前的模型具有相同的質量,並且準確地保留了說話者的聲音。
  • 重要的是要考慮可能的道德問題,例如與口音相關的偏見和模仿聲音的濫用。
  • O Google 強調了實施保護措施的重要性,並研究了檢測該技術的道德使用的方法,例如音訊浮水印。
  • 聽一下由 SoundStorm 產生的英文音訊範例:

另見:

向上滑動