Chamado de Voice Generation, o modelo está em desenvolvimento desde o final de 2022 e potencializa o recurso Read Aloud no ChatGPT.
A OpenAI está oferecendo acesso limitado a uma plataforma de geração de texto para voz desenvolvida por ela, chamada Voice Engine, que pode criar uma voz sintética baseada em um clipe de 15 segundos da voz de alguém.
A voz gerada por inteligência artificial pode ler instruções de texto sob comando no mesmo idioma do locutor ou em vários outros idiomas.
“Essas implantações em pequena escala estão ajudando a informar nossa abordagem, salvaguardas e pensamentos sobre como o Voice Engine poderia ser usado para o bem em vários setores”, disse OpenAI em sua postagem no blog .
As empresas com acesso incluem a empresa de tecnologia educacional Age of Learning, a plataforma de narrativa visual HeyGen, o fabricante de software de saúde de linha de frente Dimagi, o criador do aplicativo de comunicação de IA Livox e o sistema de saúde Lifespan.
Nestes exemplos postados pela OpenAI, você pode ouvir o que Age of Learning tem feito com a tecnologia para gerar conteúdo de narração pré-roteirizado, bem como ler “respostas personalizadas em tempo real” para alunos escritas por GPT-4 .
Primeiro, o áudio de referência em inglês:
E aqui estão três clipes de áudio gerados por IA com base nessa amostra:
A geração de texto para áudio por inteligência artificial é uma área da IA generativa que continua a evoluir. Embora a maioria se concentre em sons instrumentais ou naturais, poucos se concentram na geração de voz.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 09:52
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…