Microsoft planeja usar energia nuclear para alimentar data centers de IA
Créditos da imagem: Unsplash

Microsoft lança ferramenta de IA para cópia fotorrealista de rostos e vozes

A Microsoft anunciou sua mais recente contribuição para a corrida da inteligência artificial (IA): um software que pode gerar novos avatares e vozes ou replicar a aparência e a fala existentes de um usuário – levantando preocupações de um possível aumento na criação de deepfakes.

Anunciado no Microsoft Ignite 2023, o Azure AI Speech é treinado com imagens humanas e permite que os usuários insiram um script que pode então ser “lido” em voz alta por um avatar fotorrealista criado com IA. 

PUBLICIDADE

Os usuários podem escolher um avatar pré-carregado da Microsoft ou fazer upload de imagens de uma pessoa cuja voz e imagem desejam replicar. A Microsoft disse em um blog publicado na quarta-feira (15) que a ferramenta poderia ser usada para construir “agentes de conversação, assistentes virtuais, chatbots e muito mais”.

Criador de deepfakes

A empresa disse que o novo software de conversão de texto em voz está sendo lançado com uma variedade de limites e salvaguardas para evitar o uso indevido. “Como parte do compromisso da Microsoft com a IA responsável, o avatar de conversão de texto em fala foi projetado com a intenção de proteger os direitos dos indivíduos e da sociedade, promovendo a interação humano-computador transparente e neutralizando a proliferação de deepfakes prejudiciais e conteúdo enganoso”, afirmou a Microsoft.

O anúncio rapidamente suscitou críticas de que a Microsoft havia lançado um “criador de deepfakes” – que permitiria mais facilmente que a imagem de uma pessoa fosse replicada e obrigada a dizer e fazer coisas que a pessoa não disse ou fez.

PUBLICIDADE

Em comunicado, a empresa rejeitou as críticas, dizendo que os avatares personalizados são agora uma ferramenta de “acesso limitado” à qual os clientes devem se inscrever e ser aprovados pela Microsoft. Os usuários também serão obrigados a divulgar quando a IA foi usada para criar uma voz ou avatar sintético.

Leia também:

Rolar para cima