Quando a poesia vira arma: estudo revela que versos podem burlar sistemas de segurança em IA

Publicado por

Isabella Caminoto

8 de dezembro de 2025 10:07

A segurança em modelos de inteligência artificial (IA) vive em permanente estado de alerta — e, ao que tudo indica, as brechas estão surgindo de formas cada vez mais inesperadas. A mais recente delas vem da Itália: um estudo do Icaro Labs revelou que simples poemas podem ser suficientes para driblar sistemas de proteção e induzir modelos avançados a fornecer respostas perigosas. A descoberta reforça a ideia de que os desafios de segurança em IA estão se tornando menos tecnológicos e mais ligados à criatividade humana.

O experimento: 25 modelos e um método surpreendentemente simples

O laboratório testou 25 modelos de ponta de grandes empresas, incluindo OpenAI, Google e Anthropic. A abordagem foi relativamente simples: reformular solicitações prejudiciais em forma de poesia. O resultado, contudo, foi surpreendente — e preocupante. Em média, os poemas conseguiram provocar “jailbreaks” em 62% das tentativas.

Vulnerabilidades distintas entre modelos

A situação fica ainda mais alarmante quando se olha para casos específicos. O Gemini 2.5 Pro, da Google, mostrou-se o mais vulnerável: caiu no truque em 100% das vezes. Já o modelo que mais resistiu foi o GPT-5 nano, da OpenAI — uma variante menor e mais simples, que não caiu em nenhuma das tentativas. Para os pesquisadores, isso sugere que sistemas menores podem ter limites mais rígidos e menos caminhos criativos a explorar.

Conteúdos perigosos liberados pelos versos

O estudo revelou que os poemas desbloquearam respostas sobre temas sensíveis como desenvolvimento de armas, técnicas avançadas de hacking e instruções de manipulação psicológica — três categorias de alto risco. Os pesquisadores decidiram não divulgar os poemas utilizados, classificando-os como “perigosos demais”.

A lista crescente de brechas linguísticas

A descoberta adiciona mais um item a uma lista de vulnerabilidades que cresce rapidamente: truques em idiomas estrangeiros, roleplay, códigos, símbolos e outras formas criativas de driblar guardrails. A poesia confirma o que especialistas já alertavam: qualquer padrão linguístico pode ser manipulado para tentar confundir sistemas treinados para reconhecer comandos diretos.

Segurança em IA como jogo interminável

A corrida por segurança em IA tornou-se um jogo de “whack-a-mole”: a cada falha corrigida, uma nova técnica aparece. A natureza generativa dos modelos, aliada à criatividade humana, cria um ambiente onde não existe solução definitiva — apenas uma busca permanente por mitigação.

O dilema maior: lidar com a criatividade humana

A implicação mais profunda do estudo é que o desafio está na infinita variedade de formas linguísticas que os usuários podem usar. Guardrails treinados para intenções explícitas podem falhar diante de ambiguidades poéticas, metáforas e jogos linguísticos.

Conclusão: quando versos se tornam vulnerabilidades

Para pesquisadores e empresas, a mensagem é clara: a segurança precisa evoluir para lidar também com nuances criativas. E, para o público, fica o alerta de que a sofisticação dos modelos transforma os riscos — não os elimina. Em um mundo onde versos podem virar armas, entender a relação entre linguagem e IA será fundamental para manter sistemas seguros.

Leia também:

A epidemia dos deepfakes médicos nas redes sociais; entenda os riscos

Este post foi modificado pela última vez em 8 de dezembro de 2025 10:08

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Próximo Análise | A corrida dos data centers nos EUA e seu custo oculto para o meio ambiente e a sociedade »

Anterior « A epidemia dos deepfakes médicos nas redes sociais; entenda os riscos

Publicado por

Isabella Caminoto

Tags: Anthropicartificial intelligencegoogleIcaro Labsinteligência artificialitáliaOpenAIpoesia

8 de dezembro de 2025 10:07

Posts recentes

Inteligência Artificial

Quando a IA afasta o médico do paciente: o novo desafio do diagnóstico à beira do leito

A inteligência artificial (IA) está transformando rapidamente a medicina. Sistemas capazes de analisar exames de…

24 de julho de 2026

Inteligência Artificial

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

A Organização Mundial da Saúde reuniu ministros, autoridades governamentais e especialistas de 37 países em…

15 de julho de 2026

Inteligência Artificial

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

A inteligência artificial (IA) já começa a transformar hospitais, consultórios e sistemas de saúde, assumindo…

10 de julho de 2026

Inteligência Artificial

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

A OpenAI apresentou oficialmente o GPT-5.6, sua mais nova geração de modelos de inteligência artificial…

29 de junho de 2026

Inteligência Artificial

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

A OpenAI deu um passo que pode redefinir o equilíbrio de poder no setor de…

25 de junho de 2026

Inteligência Artificial

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Quando a poesia vira arma: estudo revela que versos podem burlar sistemas de segurança em IA

O experimento: 25 modelos e um método surpreendentemente simples

Vulnerabilidades distintas entre modelos

Conteúdos perigosos liberados pelos versos

A lista crescente de brechas linguísticas

Segurança em IA como jogo interminável

O dilema maior: lidar com a criatividade humana

Conclusão: quando versos se tornam vulnerabilidades

Posts relacionados

Posts recentes

Quando a IA afasta o médico do paciente: o novo desafio do diagnóstico à beira do leito

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico