Google SoundStorm: 효율적인 오디오 생성을 위한 인공 지능

O Google 효율적인 오디오 생성을 위한 혁신적인 인공 지능인 SoundStorm을 출시했습니다.

  • SoundStorm은 다양한 음성의 대화를 합성하고 텍스트 및 사실적인 팟캐스트에서 오디오 콘텐츠를 생성하는 등 새로운 가능성을 열어줍니다.
  • 이전 버전과 달리 SoundStorm은 30초 단위로 오디오를 생성하므로 효율성이 향상됩니다.
  • 그는 ~였다 훈련받은 대규모 대화 데이터 세트를 통해 음성 언어에 대한 강력한 이해를 보장합니다.
  • SoundStorm은 이전 모델보다 30배 빠르며 단 0,5초 만에 XNUMX초 분량의 오디오를 생성할 수 있습니다.
  • 이 도구는 아직 일반 대중에게 공개되지 않았지만 연구 제시된 내용은 AI가 어떻게 작동해야 하는지 보여줍니다.
  • SoundStorm에서 생성된 오디오는 이전 모델과 동일한 품질을 가지며 화자의 음성을 정확하게 보존합니다.
  • 목소리를 모방할 때 악센트 및 남용과 관련된 편견과 같은 가능한 윤리적 문제를 고려하는 것이 중요합니다.
  • O Google 보호 구현의 중요성을 강조하고 오디오 워터마킹과 같은 이 기술의 윤리적 사용을 탐지하는 방법을 연구합니다.
  • SoundStorm에서 생성된 오디오의 예를 영어로 들어보세요.

참조 :

스크롤