Google SoundStorm: 효율적인 오디오 생성을 위한 인공 지능

로 우슬리 듀랑스 / 30/05/2023 / 1분 읽기

O Google 효율적인 오디오 생성을 위한 혁신적인 인공 지능인 SoundStorm을 출시했습니다.

SoundStorm은 다양한 음성의 대화를 합성하고 텍스트 및 사실적인 팟캐스트에서 오디오 콘텐츠를 생성하는 등 새로운 가능성을 열어줍니다.
이전 버전과 달리 SoundStorm은 30초 단위로 오디오를 생성하므로 효율성이 향상됩니다.
그는 ~였다 훈련받은 대규모 대화 데이터 세트를 통해 음성 언어에 대한 강력한 이해를 보장합니다.
SoundStorm은 이전 모델보다 30배 빠르며 단 0,5초 만에 XNUMX초 분량의 오디오를 생성할 수 있습니다.
이 도구는 아직 일반 대중에게 공개되지 않았지만 연구 제시된 내용은 AI가 어떻게 작동해야 하는지 보여줍니다.
SoundStorm에서 생성된 오디오는 이전 모델과 동일한 품질을 가지며 화자의 음성을 정확하게 보존합니다.
목소리를 모방할 때 악센트 및 남용과 관련된 편견과 같은 가능한 윤리적 문제를 고려하는 것이 중요합니다.
O Google 보호 구현의 중요성을 강조하고 오디오 워터마킹과 같은 이 기술의 윤리적 사용을 탐지하는 방법을 연구합니다.
SoundStorm에서 생성된 오디오의 예를 영어로 들어보세요.

참조 :

홍수 허브: 브라질의 홍수를 예측하는 인공지능

Captura-de-Tela-2023-05-29-as-18.31.27-aspect-ratio-930-440

홍수는 매년 전 세계적으로 250억 10천만 명 이상의 사람들에게 영향을 미치고 약 XNUMX억 달러의 경제적 영향을 미치는 것으로 추산됩니다. 이 문제를 완화하는 방법을 생각하면, Google 홍수 예측을 위한 인공지능(AI) 기반의 디지털 도구인 홍수 허브(Flood Hub)를 확장하고 있습니다.

저자 소개

우슬리 듀랑스