Para resolver esse problema, o ChatGPT adotou uma tática para ocultar suas origens: evita usar termos específicos de obras protegidas por direitos autorais em suas respostas. Um estudo recente conduzido por especialistas em IA da ByteDance, empresa criadora do TikTok, revelou esse truque digital. Seu objetivo é tornar os modelos de IA mais “confiáveis” e proteger a propriedade intelectual.
PUBLICIDADE
Os pesquisadores descobriram casos que chamaram de “vazamento de direitos autorais”. O ChatGPT ocasionalmente falhava, revelando frases e palavras protegidas por direitos autorais.
O estudo examinou o desempenho de vários modelos de IA, incluindo ChatGPT, OPT-1.3B da Meta, FLAN-T5 do Google, entre outros. Ao fornecer a esses modelos sugestões da sequência literária de Harry Potter, os pesquisadores testaram se eles reproduziriam o conteúdo da marca registrada. Os resultados mostraram que os modelos frequentemente repetiam frases e palavras dos livros com notável precisão.