A startup francesa Kyutai acaba de apresentar o Moshi, um novo assistente de voz inteligência artificial (IA) em “tempo real” capaz de responder com uma gama de emoções e estilos, similar ao recurso Modo de Voz adiado da OpenAI.
PUBLICIDADE
Saiba os detalhes
- O Moshi consegue ouvir e falar simultaneamente, expressando 70 emoções diferentes e estilos de fala que vão desde sussurros até sotaques variados.
- A Kyutai afirma que o Moshi é o primeiro assistente de voz IA em tempo real lançado, com uma latência de 160ms, o que potencialmente supera a oferta da OpenAI.
- O grupo sem fins lucrativos planeja disponibilizar a pesquisa e o modelo como código aberto nas próximas semanas. Atualmente, o Moshi pode ser testado através da plataforma Hugging Face.
- A startup foi fundada em 2023 com um financiamento de US$ 324 milhões. Uma equipe de apenas oito pesquisadores desenvolveu o Moshi em apenas quatro meses.
Por que isso importa
O Moshi parece ser uma grande vitória para o cenário de IA francês e mais um rival promissor que diminui a vantagem percebida da OpenAI sobre o restante do campo. Além disso, com aquele sotaque francês único, certamente não haverá preocupações ao estilo “Scarlett Johansson” com o lançamento deste modelo.
Leia também: