Chatbots como ChatGPT e geradores de imagens como Stable Diffusion são “treinados” em um vasto conjunto de dados retirados da Internet, muitos deles cobertos por direitos autorais – uma proteção legal contra o trabalho de alguém ser usado sem permissão.
PUBLICIDADE
No mês passado, o New York Times processou a OpenAI e a Microsoft, que é um dos principais investidores em OpenAI e utiliza as suas ferramentas nos seus produtos, sob a acusação de “uso ilegal” do seu trabalho para criar os seus produtos.
Em uma submissão ao comitê de comunicação e seleção digital da Câmara dos Lordes, do Reino Unido, a OpenAI disse que não poderia treinar grandes modelos de linguagem, como seu modelo GPT-4 – a tecnologia por trás do ChatGPT – sem acesso a trabalhos protegidos por direitos autorais.
“Como os direitos autorais hoje cobrem praticamente todo tipo de expressão humana – incluindo postagens em blogs, fotografias, postagens em fóruns, fragmentos de código de software e documentos governamentais – seria impossível treinar os principais modelos de IA da atualidade sem usar materiais protegidos por direitos autorais”, afirmou a OpenAI.
PUBLICIDADE
A empresa acrescentou que limitar os materiais de formação a livros e desenhos sem direitos de autor produziria sistemas de IA inadequados: “Limitar os dados de formação a livros e desenhos de domínio público criados há mais de um século poderia produzir uma experiência interessante, mas não forneceria sistemas de IA que atender às necessidades dos cidadãos de hoje.”
A defesa das empresas de IA relativamente à utilização de material protegido por direitos de autor tende a apoiar-se na doutrina jurídica do “uso justo”, que permite a utilização de conteúdo em determinadas circunstâncias sem procurar a permissão do proprietário.
Leia também: