Empresas de licenciamento de dados para IA criam associação para ética e direitos autorais
Sete empresas vendedoras de licenciamento de conteúdo – música, imagens, vídeos e outros tipos de dados – para treinar sistemas de inteligência artificial (IA) anunciaram nesta quarta-feira (26) a criação do primeiro grupo comercial do setor.
A “Dataset Providers Alliance” (DPA) defenderá a “obtenção ética de dados” no treinamento de sistemas de IA, incluindo os direitos das pessoas retratadas nesses dados e a proteção da propriedade intelectual dos criadores de conteúdo, disseram as empresas em um comunicado.
Membros fundadores incluem a Rightsify (EUA, dados musicais), vAIsual (serviço de licenciamento de imagens), Pixta (provedora japonesa de bancos de imagens) e Datarade (plataforma alemã de comércio de dados).
O surgimento recente de tecnologias de IA generativa capazes de imitar a criatividade humana gerou revolta entre criadores de conteúdo e uma série de processos por direitos autorais contra empresas de tecnologia como Google, Meta e a OpenAI, criadora do ChatGPT (financiada pela Microsoft).
Desenvolvedores vinham treinando modelos alimentando-os com vastas quantidades de conteúdo, muitas vezes obtido gratuitamente pela internet, sem o consentimento dos criadores das obras ou detentores dos direitos autorais.
Embora as empresas de tecnologia aleguem legalidade no uso, elas também vêm silenciosamente pagando por acesso a coleções privadas de conteúdo para atender a necessidades específicas de dados e se proteger de riscos legais e regulatórios.
A perspectiva de aumento na demanda por dados licenciados, caso os detentores de direitos autorais vençam as batalhas legais, impulsionou o surgimento de uma indústria emergente de empresas que empacotam e vendem acesso a esse conteúdo para uso em sistemas de IA.
Como resultado, surgiram grupos para estabelecer padrões éticos nesse mercado, como a Fairly Trained, uma organização sem fins lucrativos fundada este ano que certifica modelos de IA que não utilizaram materiais protegidos por direitos autorais sem licença.
A DPA foca no conteúdo dessas transações. Por exemplo, exige que seus membros se comprometam a não vender dados de texto obtidos por varredura da web ou áudio que contenha vozes de pessoas sem o consentimento explícito delas.
“O lobby será uma grande parte disso, porque todos já tomaram suas posições sobre IA e direitos autorais, mas muitas dessas batalhas ainda precisam ser resolvidas e isso levará tempo”, disse Alex Bestall, CEO da Rightsify e sua subsidiária de licenciamento GCX, que liderou a fundação do grupo.
A DPA também pressionará por mais exigências de transparência nos dados de treinamento, como as previstas na Lei de IA da União Europeia e em um projeto de lei similar introduzido nos EUA em abril, a Lei de Divulgação de Direitos Autorais de IA Generativa, acrescentou ele.
O grupo planeja publicar um white paper delineando suas posições em julho, finalizou Bestall.
Leia também:
Este post foi modificado pela última vez em 26 de junho de 2024 17:39
O Centro de Jornalismo Investigativo (CJI), organização sem fins lucrativos responsável pelo Mother Jones e…
A parceria da Microsoft com a OpenAI e o acordo de inteligência artificial (IA) do…
Os ministros do comércio e da indústria dos EUA, Japão e Coreia do Sul prometeram…
A tentativa da Nokia de comprar a fabricante americana de equipamentos de redes ópticas Infinera…
A disseminação de sistemas baseados em inteligência artificial (IA) oferece grandes oportunidades para as empresas…
O crescimento das empresas que estão estabelecendo Centros de Capacidade Global (GCCs) na Índia está…