Créditos da imagem: AWS

Nova Sonic: Nova voz e vídeo aprimorado da Amazon

A Amazon acaba de lançar o Nova Sonic, um novo modelo de voz para interações vocais semelhantes às humanas — juntamente com um modelo de vídeo Nova Reels 1.1 atualizado, com qualidade e duração de geração aprimoradas.

PUBLICIDADE

Detalhes da Nova Sonic
  • O Nova Sonic processa entrada de voz e gera fala natural com uma latência de 1,09 segundos, superando os modelos de voz da OpenAI por margens significativas.
  • O Sonic alcançou uma taxa de erro de palavras de 4,2% em vários idiomas e mostrou uma precisão 46,7% melhor que o GPT-4o para ambientes ruidosos com múltiplos falantes.
  • O Reel 1.1 estende as gerações de vídeo para 2 minutos por meio de modos automático e manual, permitindo que os usuários criem conteúdo cena por cena ou com prompts únicos.
  • Ambos os modelos estão disponíveis através do Amazon Bedrock, com o Nova Sonic custando aproximadamente 80% menos que as opções comparáveis da OpenAI.
Por que isso é importante

O golpe duplo da Amazon em voz e vídeo mostra a gigante do varejo levando a sério a corrida da IA generativa em todos os aspectos. Com sua ferramenta de navegador agente Act, a infusão de IA do Alexa+ e outros esforços, a Amazon está apresentando um argumento mais forte do que nunca para que os desenvolvedores considerem sua pilha de IA em vez de concorrentes mais populares.

Leia também:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima