A OpenAI afirmou que seria impossível criar ferramentas como seu inovador chatbot ChatGPT sem acesso a material protegido por direitos autorais. A declaração foi feita em meio à crescente pressão sobre as empresas de inteligência artificial (IA) sobre o conteúdo usado para treinar seus produtos.
Chatbots como ChatGPT e geradores de imagens como Stable Diffusion são “treinados” em um vasto conjunto de dados retirados da Internet, muitos deles cobertos por direitos autorais – uma proteção legal contra o trabalho de alguém ser usado sem permissão.
No mês passado, o New York Times processou a OpenAI e a Microsoft, que é um dos principais investidores em OpenAI e utiliza as suas ferramentas nos seus produtos, sob a acusação de “uso ilegal” do seu trabalho para criar os seus produtos.
Em uma submissão ao comitê de comunicação e seleção digital da Câmara dos Lordes, do Reino Unido, a OpenAI disse que não poderia treinar grandes modelos de linguagem, como seu modelo GPT-4 – a tecnologia por trás do ChatGPT – sem acesso a trabalhos protegidos por direitos autorais.
“Como os direitos autorais hoje cobrem praticamente todo tipo de expressão humana – incluindo postagens em blogs, fotografias, postagens em fóruns, fragmentos de código de software e documentos governamentais – seria impossível treinar os principais modelos de IA da atualidade sem usar materiais protegidos por direitos autorais”, afirmou a OpenAI.
A empresa acrescentou que limitar os materiais de formação a livros e desenhos sem direitos de autor produziria sistemas de IA inadequados: “Limitar os dados de formação a livros e desenhos de domínio público criados há mais de um século poderia produzir uma experiência interessante, mas não forneceria sistemas de IA que atender às necessidades dos cidadãos de hoje.”
A defesa das empresas de IA relativamente à utilização de material protegido por direitos de autor tende a apoiar-se na doutrina jurídica do “uso justo”, que permite a utilização de conteúdo em determinadas circunstâncias sem procurar a permissão do proprietário.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 15:24
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…