[gtranslate]

Stability AI lança ferramenta de IA que gera música a partir de prompts de texto; conheça o Stable Audio

A Stability AI, empresa de inteligência artificial por trás do Stable Diffusion, anunciou nesta quarta (13) o lançamento de seu produto inaugural de IA para geração de música e som, o Stable Audio. O produto é voltado para usuários que buscam criar amostras para suas músicas e faixas de áudio.

Publicado por
Uesley Durães

Com o Stable Audio, os usuários podem inserir prompts de texto para gerar faixas de áudio com o comprimento desejado. Por exemplo, um usuário pode inserir “Pós-Rock, Guitarras, Kit de Bateria, Baixo, Cordas, Sentimental, 125 BPM” para gerar uma faixa de 95 segundos de música pós-rock com um clima eufórico.

Veja um exemplo de áudio criado com a ferramenta:

De acordo com o comunicado oficial de lançamento, o modelo fundamental do Stable Audio foi treinado usando músicas e metadados da AudioSparx, uma biblioteca de músicas. A empresa alega que o modelo é capaz de renderizar 95 segundos de áudio estéreo a uma taxa de amostragem de 44,1 kHz em menos de um segundo em uma GPU NVIDIA A100.

O Stable Audio é baseado em uma arquitetura de difusão latente que compreende vários componentes, incluindo um codificador automático variacional (VAE), um codificador de texto e um modelo de difusão condicionado baseado em U-Net.

Técnicamente, a plataforma funciona dessa forma (reprodução Stability)

O VAE transforma o áudio estéreo em uma codificação latente compacta, resistente ao ruído e reversível com perda. Essa codificação facilita a geração e o treinamento mais rápidos em comparação com o trabalho direto com amostras de áudio bruto.

A arquitetura de difusão latente aproveita os dados de áudio, levando em consideração os metadados do texto, a duração do arquivo de áudio e a hora de início. Essa abordagem permite o controle do conteúdo e da duração do áudio gerado.

O Stable Audio está disponível em duas versões: uma versão gratuita com recursos limitados e uma versão Pro com recursos estendidos. A versão Pro oferece faixas estendidas de 90 segundos, adequadas para projetos comerciais.

“Esperamos que o Stable Audio capacite entusiastas da música e profissionais criativos para gerar novo conteúdo com a ajuda da IA”, disse Emad Mostaque, CEO da Stability AI.

Veja também:

Este post foi modificado pela última vez em 13 de setembro de 2023 14:00

Uesley Durães

Posts recentes

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…

22 de junho de 2026

Data centers no espaço? Musk revela plano para levar a IA à órbita terrestre

A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…

14 de junho de 2026

Metade dos norte-americanos teme perder o emprego para a IA — e a ansiedade só aumenta

A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…

13 de junho de 2026

IA supera professores de Direito em estudo de Stanford e acende debate sobre o futuro da educação jurídica; confira

A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…

9 de junho de 2026

IA tem custo ambiental maior do que se imaginava, alerta relatório da ONU

A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…

9 de junho de 2026