A tecnologia de marca d’água de texto SynthID do Google, uma ferramenta criada pela empresa para tornar o texto gerado por inteligência artificial (IA) mais fácil de identificar, agora está disponível como código aberto por meio do Google Responsible Generative AI Toolkit, anunciou a empresa no X.
“Agora, outros desenvolvedores [gerativos] de IA poderão usar essa tecnologia para ajudá-los a detectar se as saídas de texto vieram de seus próprios [grandes modelos de linguagem], tornando mais fácil para mais desenvolvedores criar IA de forma responsável”, disse Pushmeet Kohli, vice-presidente de pesquisa da Google DeepMind, à MIT Technology Review.
As marcas d’água se tornaram ferramentas cada vez mais importantes à medida que os grandes modelos de linguagem são usados para espalhar desinformação política, gerar conteúdo sexual não consensual e para outros fins maliciosos. A Califórnia já está considerando tornar a marca d’água de IA obrigatória, enquanto o governo da China começou a exigir isso no ano passado. Ainda assim, as ferramentas ainda são um trabalho em andamento.
O SynthID, que foi anunciado em agosto passado, ajuda a tornar a saída gerada por IA detectável adicionando uma marca d’água invisível a imagens, áudio, vídeo e texto à medida que são gerados. O Google diz que a versão de texto do SynthID funciona tornando a saída de texto ligeiramente menos provável de uma maneira que é detectável por software, mas não por humanos:
“Um LLM gera texto um token por vez. Esses tokens podem representar um único caractere, palavra ou parte de uma frase. Para criar uma sequência de texto coerente, o modelo prevê o próximo token mais provável a ser gerado. Essas previsões são baseadas nas palavras precedentes e nas pontuações de probabilidade atribuídas a cada token potencial”.
“Por exemplo, com a frase “Meus frutos tropicais favoritos são __.” O LLM pode começar a completar a frase com os tokens “manga”, “lichia”, “mamão” ou “durian”, e cada token recebe uma pontuação de probabilidade. Quando há uma variedade de tokens diferentes para escolher, o SynthID pode ajustar a pontuação de probabilidade de cada token previsto, nos casos em que não comprometerá a qualidade, precisão e criatividade da saída”.
“Esse processo é repetido ao longo do texto gerado, de modo que uma única frase pode conter dez ou mais pontuações de probabilidade ajustadas, e uma página pode conter centenas. O padrão final de pontuações para as escolhas de palavras do modelo, combinado com as pontuações de probabilidade ajustadas, são consideradas a marca d’água.”
O Google afirma que o sistema, que já está integrado ao seu chatbot Gemini, não compromete a qualidade, precisão, criatividade ou velocidade do texto gerado, o que há muito tem sido um problema com sistemas de marca d’água. O Google diz que pode funcionar em textos tão curtos quanto três frases, bem como em textos que foram cortados, parafraseados ou modificados. Mas ele tem dificuldade com textos curtos, conteúdo que foi reescrito ou traduzido e até mesmo respostas a perguntas factuais.
“O SynthID não é uma bala de prata para identificar conteúdo gerado por IA”, escreveu o Google em um post de blog em maio. “[Mas é] um importante bloco de construção para o desenvolvimento de ferramentas de identificação de IA mais confiáveis e pode ajudar milhões de pessoas a tomar decisões informadas sobre como interagir com conteúdo gerado por IA.”
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 18:47
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…
A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…
Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…
A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…