Sete empresas vendedoras de licenciamento de conteúdo – música, imagens, vídeos e outros tipos de dados – para treinar sistemas de inteligência artificial (IA) anunciaram nesta quarta-feira (26) a criação do primeiro grupo comercial do setor.
A “Dataset Providers Alliance” (DPA) defenderá a “obtenção ética de dados” no treinamento de sistemas de IA, incluindo os direitos das pessoas retratadas nesses dados e a proteção da propriedade intelectual dos criadores de conteúdo, disseram as empresas em um comunicado.
Membros fundadores incluem a Rightsify (EUA, dados musicais), vAIsual (serviço de licenciamento de imagens), Pixta (provedora japonesa de bancos de imagens) e Datarade (plataforma alemã de comércio de dados).
O surgimento recente de tecnologias de IA generativa capazes de imitar a criatividade humana gerou revolta entre criadores de conteúdo e uma série de processos por direitos autorais contra empresas de tecnologia como Google, Meta e a OpenAI, criadora do ChatGPT (financiada pela Microsoft).
Desenvolvedores vinham treinando modelos alimentando-os com vastas quantidades de conteúdo, muitas vezes obtido gratuitamente pela internet, sem o consentimento dos criadores das obras ou detentores dos direitos autorais.
Embora as empresas de tecnologia aleguem legalidade no uso, elas também vêm silenciosamente pagando por acesso a coleções privadas de conteúdo para atender a necessidades específicas de dados e se proteger de riscos legais e regulatórios.
A perspectiva de aumento na demanda por dados licenciados, caso os detentores de direitos autorais vençam as batalhas legais, impulsionou o surgimento de uma indústria emergente de empresas que empacotam e vendem acesso a esse conteúdo para uso em sistemas de IA.
Como resultado, surgiram grupos para estabelecer padrões éticos nesse mercado, como a Fairly Trained, uma organização sem fins lucrativos fundada este ano que certifica modelos de IA que não utilizaram materiais protegidos por direitos autorais sem licença.
A DPA foca no conteúdo dessas transações. Por exemplo, exige que seus membros se comprometam a não vender dados de texto obtidos por varredura da web ou áudio que contenha vozes de pessoas sem o consentimento explícito delas.
“O lobby será uma grande parte disso, porque todos já tomaram suas posições sobre IA e direitos autorais, mas muitas dessas batalhas ainda precisam ser resolvidas e isso levará tempo”, disse Alex Bestall, CEO da Rightsify e sua subsidiária de licenciamento GCX, que liderou a fundação do grupo.
A DPA também pressionará por mais exigências de transparência nos dados de treinamento, como as previstas na Lei de IA da União Europeia e em um projeto de lei similar introduzido nos EUA em abril, a Lei de Divulgação de Direitos Autorais de IA Generativa, acrescentou ele.
O grupo planeja publicar um white paper delineando suas posições em julho, finalizou Bestall.
Leia também:
Este post foi modificado pela última vez em 26 de junho de 2024 17:39
A Walt Disney está formando um novo grupo para coordenar o uso da empresa de…
A Nvidia acaba de publicar uma nova pesquisa apresentando o HOVER, uma pequena rede neural…
O ChatGPT agora é oficialmente um mecanismo de busca com inteligência artificial (IA). A empresa…
A Ucrânia está usando dezenas de sistemas de inteligência artificial (IA) fabricados localmente para seus…
A Alphabet, dona do Google, anunciou na quinta-feira (31) um conjunto de recursos que incorporam…
A startup de design Recraft acaba de anunciar seu novo modelo de inteligência artificial (IA)…