Créditos da imagem: AFP

Google lança ferramenta para evitar que sites sejam usados para treinar seus modelos de IA; saiba mais sobre o Google-Extended

O Google anunciou, na última quinta-feira (28), o lançamento do Google-Extended, um novo controle de privacidade para editores de sites para desabilitar o uso de seus dados para treinamento de modelos de inteligência artificial da empresa.

O Google-Extended permite que os editores optem por não serem utilizados para treinar os modelos de inteligência artificial do Bard e Vertex AI. O Bard é o principal produto do setor do Google, que foi lançado para bater de frente com o ChatGPT. O Vertex AI, por sua vez, é uma plataforma em nuvem com foco em empresas.

PUBLICIDADE

A solução funciona rastreando o tráfego HTTP dos sites usando cadeias de caracteres existentes do agente do usuário do Google. O token de agente do usuário “robots.txt” é utilizado em uma capacidade de controle.

O anúncio do Google vem em resposta às preocupações de privacidade de pessoas e empresas que não querem ter seus conteúdos expostos para treinar os modelos de linguagem dessas ferramentas.

O Google-Extended está disponível para todos os editores de sites. Para habilitar o controle, os editores devem adicionar o seguinte código ao arquivo robots.txt de seus sites:

PUBLICIDADE

User-agent: *

Disallow: /

O anúncio do Google-Extended também destaca os riscos associados aos serviços de inteligência artificial generativa. Esses serviços, como o ChatGPT e o Bard, são treinados em grandes conjuntos de dados de texto e código. Isso significa que eles podem ser usados para gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder a perguntas de forma informativa.

Antes do Google, a OpenAI também vem sofrendo pressão por empresas ao redor do mundo por colocar o GPTbot, o rastreador de conteúdos do ChatGPT, para varrer sites.

Veja também:

Rolar para cima