Google SoundStorm：用于高效音频生成的人工智能

通过尤斯利·杜拉斯 / 30/05/2023 / 1分钟阅读

O Google 推出了 SoundStorm，这是一项用于高效生成音频的人工智能创新。

SoundStorm 可以合成不同声音的对话并开辟新的可能性，例如从文本和真实播客创建音频内容。
与其前身不同，SoundStorm 以 30 秒的块生成音频，从而提高了效率。
他是训练有素拥有大量对话数据集，确保对口语的深入理解。
SoundStorm 的速度是之前型号的两倍，只需 30 秒即可生成 0,5 秒的音频。
该工具尚未普及到公众，但是研究展示了人工智能应该如何工作。
SoundStorm 生成的音频与之前的模型具有相同的质量，并且准确地保留了说话者的声音。
重要的是要考虑可能的道德问题，例如与口音相关的偏见和模仿声音的滥用。
O Google 强调了实施保护措施的重要性，并研究了检测该技术的道德使用的方法，例如音频水印。
听一下由 SoundStorm 生成的英语音频示例：

另请参阅：

洪水中心：预测巴西洪水的人工智能

Captura-de-Tela-2023-05-29-as-18.31.27-aspect-ratio-930-440

据估计，洪水每年影响全球超过 250 亿人，造成约 10 亿美元的经济影响。考虑缓解这个问题 Google 正在扩展基于人工智能 (AI) 的洪水预报数字工具：洪水中心。

关于作者

尤斯利·杜拉斯