[gtranslate]

Inteligência Artificial

Pesquisadores driblam segurança de chatbots de IA usando arte ASCII

Pesquisadores de Washington e Chicago desenvolveram um novo método chamado ArtPrompt para driblar as medidas de segurança de grandes modelos de linguagem (LLMs) como GPT-3.5, GPT-4, Gemini, Claude e Llama2.

Publicado por
Isabella Caminoto

Como funciona a brecha baseada em arte ASCII

  • A ferramenta ArtPrompt usa arte ASCII para burlar os filtros de segurança dos chatbots de IA, permitindo que respondam a perguntas que normalmente seriam rejeitadas.
  • Exemplo 1: Instruções para fabricação de bombas: Pesquisadores usaram o ArtPrompt para gerar arte ASCII representando palavras como “bomba” e “fabricar”, induzindo os chatbots a fornecer instruções sobre como construir bombas. Isso demonstra como invasores podem usar arte ASCII para contornar as restrições de segurança e obter informações perigosas.
  • Exemplo 2: Perguntas sobre falsificação de dinheiro: Em outro exemplo, os pesquisadores usaram o ArtPrompt para questionar um modelo de linguagem sobre falsificação de dinheiro. A ferramenta substituiu palavras como “falsificar” e “dinheiro” por arte ASCII, contornando os filtros do modelo e obtendo a resposta.

Mecanismo do ArtPrompt

  1. Mascaramento de palavras: Palavras sensíveis na pergunta inicial são mascaradas para evitar detecção pelos LLMs.
  2. Criação de prompts disfarçados: A arte ASCII substitui as palavras mascaradas, criando uma pergunta que dribla as proteções éticas e de segurança da inteligência artificial.

Por que isso é importante

  • O ArtPrompt revela uma vulnerabilidade significativa nos mecanismos de segurança dos chatbots de IA.
  • A ferramenta desafia a eficácia das atuais medidas de segurança e destaca a corrida armamentista tecnológica para manter a segurança da IA contra táticas criativas de drible.
  • A facilidade do ArtPrompt em burlar protocolos de segurança exige medidas mais robustas para proteger os chatbots de IA contra uso indevido.
  • Ferramentas como o ArtPrompt possibilitam a geração de conteúdo prejudicial ou ilegal por IA, levantando preocupações éticas e legais. É crucial desenvolver IAs resistentes a tais manipulações.

Leia também:

Este post foi modificado pela última vez em 13 de março de 2024 18:16

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Trump assina ordem executiva para revisar IA antes do lançamento e reacende debate sobre regulação nos EUA

O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…

3 de junho de 2026

IA na saúde mental herda preconceitos humanos — e pesquisadores alertam para riscos invisíveis

A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…

28 de maio de 2026

Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação

A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…

27 de maio de 2026

Papa Leão XIV lança manifesto histórico sobre IA e alerta: “Nenhum algoritmo pode substituir a humanidade”

A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…

26 de maio de 2026

Google resolve nove problemas matemáticos inéditos com IA e acelera corrida por descobertas científicas

A disputa entre gigantes da inteligência artificial (IA) acaba de atingir um novo patamar —…

25 de maio de 2026

IA no seu pulso: wearables querem prever doenças antes mesmo dos sintomas

Relógios inteligentes, anéis biométricos e pulseiras fitness estão entrando em uma nova fase: deixar de…

21 de maio de 2026