OpenAI desiste de marca d'água para textos do ChatGPT

O Wall Street Journal reportou que a OpenAI tem um sistema para marcar textos criados pelo ChatGPT com marca d’água e uma ferramenta para detectar essa marca d’água pronta há cerca de um ano. No entanto, a empresa está dividida internamente sobre se deve lançá-la. Por um lado, parece ser a coisa responsável a fazer; por outro, isso poderia prejudicar seus resultados financeiros.

A marca d’água da OpenAI é descrita como um ajuste na forma como o modelo prevê as palavras e frases mais prováveis que seguirão as anteriores, criando um padrão detectável. (Isso é uma simplificação, mas você pode conferir a explicação mais detalhada do Google sobre a marca d’água de texto do Gemini para mais informações).

Oferecer qualquer maneira de detectar material escrito por inteligência artificial (IA) é um potencial benefício para professores tentando dissuadir os alunos de entregar tarefas de escrita para a IA. O Wall Street Journal relata que a empresa descobriu que a marca d’água não afetou a qualidade do texto produzido pelo chatbot. Em uma pesquisa encomendada pela empresa, “as pessoas em todo o mundo apoiaram a ideia de uma ferramenta de detecção de IA por uma margem de quatro para um”, escreve o jornal.

Após a publicação da história pelo Journal, a OpenAI confirmou que tem trabalhado na marcação de textos com uma marca d’água em uma atualização de blog, que foi vista pelo TechCrunch. Nela, a empresa diz que seu método é muito preciso (“99,9% eficaz”, segundo documentos vistos pelo Journal) e resistente a “adulterações, como paráfrases”. Mas diz que técnicas como reescrever com outro modelo tornam “trivial a evasão por atores mal-intencionados”. A empresa também diz estar preocupada com a estigmatização da utilidade das ferramentas de IA para falantes não nativos.

Mas parece que a OpenAI também está preocupada que o uso de marcação com marca d’água possa afastar usuários pesquisados do ChatGPT, quase 30 por cento dos quais aparentemente disseram à empresa que usariam o software menos se a marca d’água fosse implementada.

Apesar disso, alguns funcionários ainda acham que a marcação é eficaz. À luz dos persistentes sentimentos dos usuários, no entanto, o Journal diz que alguns sugeriram tentar métodos que são “potencialmente menos controversos entre os usuários, mas não comprovados”. Em sua atualização de blog hoje, a empresa disse que está “nos estágios iniciais” de explorar a incorporação de metadados. Diz que ainda é “muito cedo” para saber como isso funcionará, mas que, por ser criptograficamente assinado, não haveria falsos positivos.

Leia também:

IA é capaz de ouvir e falar simultaneamente; saiba mais