Pesquisa mostra que ChatGPT reproduz conteúdo protegido por direitos autorais

O ChatGPT, juntamente com outras ferramentas de inteligência artificial, está se esforçando para navegar no mundo do conteúdo protegido por direitos autorais. À medida que esses modelos de IA exploram a vasta extensão de informações digitais, eles devem garantir que não divulguem material protegido por direitos autorais.

Para resolver esse problema, o ChatGPT adotou uma tática para ocultar suas origens: evita usar termos específicos de obras protegidas por direitos autorais em suas respostas. Um estudo recente conduzido por especialistas em IA da ByteDance, empresa criadora do TikTok, revelou esse truque digital. Seu objetivo é tornar os modelos de IA mais “confiáveis” e proteger a propriedade intelectual.

PUBLICIDADE

Os pesquisadores descobriram casos que chamaram de “vazamento de direitos autorais”. O ChatGPT ocasionalmente falhava, revelando frases e palavras protegidas por direitos autorais.

O estudo examinou o desempenho de vários modelos de IA, incluindo ChatGPT, OPT-1.3B da Meta, FLAN-T5 do Google, entre outros. Ao fornecer a esses modelos sugestões da sequência literária de Harry Potter, os pesquisadores testaram se eles reproduziriam o conteúdo da marca registrada. Os resultados mostraram que os modelos frequentemente repetiam frases e palavras dos livros com notável precisão.

Veja também:

Rolar para cima