Inteligência Artificial

IA de clonagem de voz da OpenAI precisa de apenas 15 segundos para funcionar

Chamado de Voice Generation, o modelo está em desenvolvimento desde o final de 2022 e potencializa o recurso Read Aloud no ChatGPT.

Publicado por
Juliana Caminoto

A OpenAI está oferecendo acesso limitado a uma plataforma de geração de texto para voz desenvolvida por ela, chamada Voice Engine, que pode criar uma voz sintética baseada em um clipe de 15 segundos da voz de alguém.

A voz gerada por inteligência artificial pode ler instruções de texto sob comando no mesmo idioma do locutor ou em vários outros idiomas.

“Essas implantações em pequena escala estão ajudando a informar nossa abordagem, salvaguardas e pensamentos sobre como o Voice Engine poderia ser usado para o bem em vários setores”, disse OpenAI em sua postagem no blog . 

As empresas com acesso incluem a empresa de tecnologia educacional Age of Learning, a plataforma de narrativa visual HeyGen, o fabricante de software de saúde de linha de frente Dimagi, o criador do aplicativo de comunicação de IA Livox e o sistema de saúde Lifespan.

Nestes exemplos postados pela OpenAI, você pode ouvir o que Age of Learning tem feito com a tecnologia para gerar conteúdo de narração pré-roteirizado, bem como ler “respostas personalizadas em tempo real” para alunos escritas por GPT-4 .

Primeiro, o áudio de referência em inglês:

E aqui estão três clipes de áudio gerados por IA com base nessa amostra:

A geração de texto para áudio por inteligência artificial é uma área da IA ​​generativa que continua a evoluir. Embora a maioria se concentre em sons instrumentais ou naturais, poucos se concentram na geração de voz.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 09:52

Juliana Caminoto

Advogada com especialização em compliance e auditoria, estou sempre conectada às redes sociais e em busca de novos desafios. Sou mãe de pet e amo viajar.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024