Inteligência Artificial

Meta utilizou livros protegidos por direitos autorais para treinar sua IA, revela documento

Os advogados da Meta alertaram a empresa a respeito dos riscos legais de utilizar milhares de livros pirateados para treinar seus modelos de inteligência artificial (IA), mas a gigante da tecnologia prosseguiu mesmo assim. É o que revelou uma nova petição em um processo por violação de direitos autorais.

Publicado por
Vinicius Siqueira

Na última segunda-feira (11), foi apresentada uma nova petição consolidando dois processos movidos contra o proprietário do Facebook e Instagram, a Meta, pela comediante Sarah Silverman, pelo vencedor do Prêmio Pulitzer Michael Chabon e outros autores.

Eles alegam que a Meta usou suas obras sem permissão para treinar seu modelo de linguagem de inteligência artificial, o Llama.

Durante o mês de novembro um juiz da Califórnia rejeitou parte do processo de Silverman e indicou que daria aos autores permissão para alterar suas alegações. A Meta até o momento não comentou sobre as alegações.

O que diz a petição

O documento inclui registros de conversas de um pesquisador afiliado à Meta discutindo a aquisição do conjunto de dados em um servidor do Discord, algo que indicaria que a empresa estava ciente de que o uso dos livros talvez não estivesse protegido pela lei de direitos autorais dos EUA.

Nos registros de bate-papo citados na petição, o pesquisador Tim Dettmers descreve suas idas e vindas com o departamento jurídico da Meta sobre se o uso dos arquivos do livro como dados de treinamento seria “legalmente aceitável”.

“No Facebook, há muitas pessoas interessadas em trabalhar com o ‘The Pile’, incluindo eu mesmo, mas em sua forma atual, não podemos utilizá-lo por razões legais”, escreveu Dettmers em 2021, referindo-se a um conjunto de dados que a Meta reconheceu ter usado para treinar sua primeira versão do Llama, de acordo com a petição.

Diversas empresas de tecnologia têm enfrentado uma série de processos este ano de criadores de conteúdo que as acusam de utilizar obras protegidas por direitos autorais para construir seus modelos de IA generativos.

Leia também:

Siga o Curto no Google News

Este post foi modificado pela última vez em %s = human-readable time difference 14:53

Vinicius Siqueira

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024