Inteligência Artificial

IA de clonagem de voz da OpenAI precisa de apenas 15 segundos para funcionar

Chamado de Voice Generation, o modelo está em desenvolvimento desde o final de 2022 e potencializa o recurso Read Aloud no ChatGPT.

Publicado por
Juliana Caminoto

A OpenAI está oferecendo acesso limitado a uma plataforma de geração de texto para voz desenvolvida por ela, chamada Voice Engine, que pode criar uma voz sintética baseada em um clipe de 15 segundos da voz de alguém.

A voz gerada por inteligência artificial pode ler instruções de texto sob comando no mesmo idioma do locutor ou em vários outros idiomas.

“Essas implantações em pequena escala estão ajudando a informar nossa abordagem, salvaguardas e pensamentos sobre como o Voice Engine poderia ser usado para o bem em vários setores”, disse OpenAI em sua postagem no blog . 

As empresas com acesso incluem a empresa de tecnologia educacional Age of Learning, a plataforma de narrativa visual HeyGen, o fabricante de software de saúde de linha de frente Dimagi, o criador do aplicativo de comunicação de IA Livox e o sistema de saúde Lifespan.

Nestes exemplos postados pela OpenAI, você pode ouvir o que Age of Learning tem feito com a tecnologia para gerar conteúdo de narração pré-roteirizado, bem como ler “respostas personalizadas em tempo real” para alunos escritas por GPT-4 .

Primeiro, o áudio de referência em inglês:

E aqui estão três clipes de áudio gerados por IA com base nessa amostra:

A geração de texto para áudio por inteligência artificial é uma área da IA ​​generativa que continua a evoluir. Embora a maioria se concentre em sons instrumentais ou naturais, poucos se concentram na geração de voz.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 09:52

Juliana Caminoto

Advogada com especialização em compliance e auditoria, estou sempre conectada às redes sociais e em busca de novos desafios. Sou mãe de pet e amo viajar.

Posts recentes

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024

Robôs da Figure transformam produção da BMW; saiba como

Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…

20 de novembro de 2024

Microsoft revela agentes de IA especializados e ferramentas de automação

A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…

20 de novembro de 2024