Empresas de licenciamento de dados para IA criam associação para ética e direitos autorais

Publicado por

Isabella Caminoto

26 de junho de 2024 18:00

Sete empresas vendedoras de licenciamento de conteúdo – música, imagens, vídeos e outros tipos de dados – para treinar sistemas de inteligência artificial (IA) anunciaram nesta quarta-feira (26) a criação do primeiro grupo comercial do setor.

A “Dataset Providers Alliance” (DPA) defenderá a “obtenção ética de dados” no treinamento de sistemas de IA, incluindo os direitos das pessoas retratadas nesses dados e a proteção da propriedade intelectual dos criadores de conteúdo, disseram as empresas em um comunicado.

Membros fundadores incluem a Rightsify (EUA, dados musicais), vAIsual (serviço de licenciamento de imagens), Pixta (provedora japonesa de bancos de imagens) e Datarade (plataforma alemã de comércio de dados).

O surgimento recente de tecnologias de IA generativa capazes de imitar a criatividade humana gerou revolta entre criadores de conteúdo e uma série de processos por direitos autorais contra empresas de tecnologia como Google, Meta e a OpenAI, criadora do ChatGPT (financiada pela Microsoft).

Gravadoras processam empresas de IA Suno e Udio por violação de direitos autorais

Desenvolvedores vinham treinando modelos alimentando-os com vastas quantidades de conteúdo, muitas vezes obtido gratuitamente pela internet, sem o consentimento dos criadores das obras ou detentores dos direitos autorais.

Embora as empresas de tecnologia aleguem legalidade no uso, elas também vêm silenciosamente pagando por acesso a coleções privadas de conteúdo para atender a necessidades específicas de dados e se proteger de riscos legais e regulatórios.

A perspectiva de aumento na demanda por dados licenciados, caso os detentores de direitos autorais vençam as batalhas legais, impulsionou o surgimento de uma indústria emergente de empresas que empacotam e vendem acesso a esse conteúdo para uso em sistemas de IA.

Como resultado, surgiram grupos para estabelecer padrões éticos nesse mercado, como a Fairly Trained, uma organização sem fins lucrativos fundada este ano que certifica modelos de IA que não utilizaram materiais protegidos por direitos autorais sem licença.

A DPA foca no conteúdo dessas transações. Por exemplo, exige que seus membros se comprometam a não vender dados de texto obtidos por varredura da web ou áudio que contenha vozes de pessoas sem o consentimento explícito delas.

“O lobby será uma grande parte disso, porque todos já tomaram suas posições sobre IA e direitos autorais, mas muitas dessas batalhas ainda precisam ser resolvidas e isso levará tempo”, disse Alex Bestall, CEO da Rightsify e sua subsidiária de licenciamento GCX, que liderou a fundação do grupo.

A DPA também pressionará por mais exigências de transparência nos dados de treinamento, como as previstas na Lei de IA da União Europeia e em um projeto de lei similar introduzido nos EUA em abril, a Lei de Divulgação de Direitos Autorais de IA Generativa, acrescentou ele.

O grupo planeja publicar um white paper delineando suas posições em julho, finalizou Bestall.

Leia também:

Reino Unido precisa de sistema para registrar o uso indevido e mau funcionamento da IA, alerta think tank

Este post foi modificado pela última vez em %s = human-readable time difference 17:39

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.