Sete empresas vendedoras de licenciamento de conteúdo – música, imagens, vídeos e outros tipos de dados – para treinar sistemas de inteligência artificial (IA) anunciaram nesta quarta-feira (26) a criação do primeiro grupo comercial do setor.
A “Dataset Providers Alliance” (DPA) defenderá a “obtenção ética de dados” no treinamento de sistemas de IA, incluindo os direitos das pessoas retratadas nesses dados e a proteção da propriedade intelectual dos criadores de conteúdo, disseram as empresas em um comunicado.
Membros fundadores incluem a Rightsify (EUA, dados musicais), vAIsual (serviço de licenciamento de imagens), Pixta (provedora japonesa de bancos de imagens) e Datarade (plataforma alemã de comércio de dados).
O surgimento recente de tecnologias de IA generativa capazes de imitar a criatividade humana gerou revolta entre criadores de conteúdo e uma série de processos por direitos autorais contra empresas de tecnologia como Google, Meta e a OpenAI, criadora do ChatGPT (financiada pela Microsoft).
Desenvolvedores vinham treinando modelos alimentando-os com vastas quantidades de conteúdo, muitas vezes obtido gratuitamente pela internet, sem o consentimento dos criadores das obras ou detentores dos direitos autorais.
Embora as empresas de tecnologia aleguem legalidade no uso, elas também vêm silenciosamente pagando por acesso a coleções privadas de conteúdo para atender a necessidades específicas de dados e se proteger de riscos legais e regulatórios.
A perspectiva de aumento na demanda por dados licenciados, caso os detentores de direitos autorais vençam as batalhas legais, impulsionou o surgimento de uma indústria emergente de empresas que empacotam e vendem acesso a esse conteúdo para uso em sistemas de IA.
Como resultado, surgiram grupos para estabelecer padrões éticos nesse mercado, como a Fairly Trained, uma organização sem fins lucrativos fundada este ano que certifica modelos de IA que não utilizaram materiais protegidos por direitos autorais sem licença.
A DPA foca no conteúdo dessas transações. Por exemplo, exige que seus membros se comprometam a não vender dados de texto obtidos por varredura da web ou áudio que contenha vozes de pessoas sem o consentimento explícito delas.
“O lobby será uma grande parte disso, porque todos já tomaram suas posições sobre IA e direitos autorais, mas muitas dessas batalhas ainda precisam ser resolvidas e isso levará tempo”, disse Alex Bestall, CEO da Rightsify e sua subsidiária de licenciamento GCX, que liderou a fundação do grupo.
A DPA também pressionará por mais exigências de transparência nos dados de treinamento, como as previstas na Lei de IA da União Europeia e em um projeto de lei similar introduzido nos EUA em abril, a Lei de Divulgação de Direitos Autorais de IA Generativa, acrescentou ele.
O grupo planeja publicar um white paper delineando suas posições em julho, finalizou Bestall.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 17:39
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…