Inteligência Artificial

SynthID: Google libera ferramenta para identificar textos gerados por IA

Publicado por
Isabella Caminoto

A tecnologia de marca d’água de texto SynthID do Google, uma ferramenta criada pela empresa para tornar o texto gerado por inteligência artificial (IA) mais fácil de identificar, agora está disponível como código aberto por meio do Google Responsible Generative AI Toolkit, anunciou a empresa no X.

“Agora, outros desenvolvedores [gerativos] de IA poderão usar essa tecnologia para ajudá-los a detectar se as saídas de texto vieram de seus próprios [grandes modelos de linguagem], tornando mais fácil para mais desenvolvedores criar IA de forma responsável”, disse Pushmeet Kohli, vice-presidente de pesquisa da Google DeepMind, à MIT Technology Review.

As marcas d’água se tornaram ferramentas cada vez mais importantes à medida que os grandes modelos de linguagem são usados para espalhar desinformação política, gerar conteúdo sexual não consensual e para outros fins maliciosos. A Califórnia já está considerando tornar a marca d’água de IA obrigatória, enquanto o governo da China começou a exigir isso no ano passado. Ainda assim, as ferramentas ainda são um trabalho em andamento.

O SynthID, que foi anunciado em agosto passado, ajuda a tornar a saída gerada por IA detectável adicionando uma marca d’água invisível a imagens, áudio, vídeo e texto à medida que são gerados. O Google diz que a versão de texto do SynthID funciona tornando a saída de texto ligeiramente menos provável de uma maneira que é detectável por software, mas não por humanos:

“Um LLM gera texto um token por vez. Esses tokens podem representar um único caractere, palavra ou parte de uma frase. Para criar uma sequência de texto coerente, o modelo prevê o próximo token mais provável a ser gerado. Essas previsões são baseadas nas palavras precedentes e nas pontuações de probabilidade atribuídas a cada token potencial”.

“Por exemplo, com a frase “Meus frutos tropicais favoritos são __.” O LLM pode começar a completar a frase com os tokens “manga”, “lichia”, “mamão” ou “durian”, e cada token recebe uma pontuação de probabilidade. Quando há uma variedade de tokens diferentes para escolher, o SynthID pode ajustar a pontuação de probabilidade de cada token previsto, nos casos em que não comprometerá a qualidade, precisão e criatividade da saída”.

“Esse processo é repetido ao longo do texto gerado, de modo que uma única frase pode conter dez ou mais pontuações de probabilidade ajustadas, e uma página pode conter centenas. O padrão final de pontuações para as escolhas de palavras do modelo, combinado com as pontuações de probabilidade ajustadas, são consideradas a marca d’água.”

O Google afirma que o sistema, que já está integrado ao seu chatbot Gemini, não compromete a qualidade, precisão, criatividade ou velocidade do texto gerado, o que há muito tem sido um problema com sistemas de marca d’água. O Google diz que pode funcionar em textos tão curtos quanto três frases, bem como em textos que foram cortados, parafraseados ou modificados. Mas ele tem dificuldade com textos curtos, conteúdo que foi reescrito ou traduzido e até mesmo respostas a perguntas factuais.

“O SynthID não é uma bala de prata para identificar conteúdo gerado por IA”, escreveu o Google em um post de blog em maio. “[Mas é] um importante bloco de construção para o desenvolvimento de ferramentas de identificação de IA mais confiáveis ​​e pode ajudar milhões de pessoas a tomar decisões informadas sobre como interagir com conteúdo gerado por IA.”

Leia também:

Este post foi modificado pela última vez em 23 de outubro de 2024 18:47

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Genmo lança modelo de vídeo de IA de código aberto

A startup de inteligência artificial (IA) Genmo acaba de lançar Mochi 1, um novo modelo…

23 de outubro de 2024

AI Companion 2.0: Zoom lança assistente de IA atualizado

A Zoom lançou seu assistente de inteligência artificial (IA) atualizado. A Zoom diz que seu…

23 de outubro de 2024

IA Autônoma: Claude revoluciona a forma como interagimos com computadores

Uma startup de inteligência artificial (IA) apoiada pela Amazon e Google afirma ter criado um…

23 de outubro de 2024

CEO da Nvidia diz que UE está atrasada em investimentos em IA em relação aos EUA e China

A União Europeia (UE) está muito atrás dos Estados Unidos e da China em investimentos…

23 de outubro de 2024

Microsoft e OpenAI oferecem US$ 10 milhões para veículos de mídia usarem ferramentas de IA

A Microsoft e a OpenAI anunciaram que estão oferecendo a um grupo seleto de veículos…

22 de outubro de 2024

Anthropic lança IA que automatiza cliques de mouse para programadores

A Anthropic, startup apoiada pela Alphabet (controladora do Google) e Amazon.com, lançou na terça-feira (22)…

22 de outubro de 2024