Novo vírus é capaz de extrair dados a partir de IAs generativas

Um grupo de pesquisadores criou um vírus de computador capaz de explorar sistemas de inteligência artificial (IA) generativa, incluindo o Gemini Pro e a versão alimentada por GPT-4 do ChatGPT.

Publicado por

Vinicius Siqueira

7 de março de 2024 09:00

Créditos de Imagem: Curto News/BingAI

Morris II é um worm que manipula modelos de inteligência artificial (IA) generativa para realizar tarefas maliciosas, incluindo spam e roubo de dados confidenciais. Foi criado por cientistas do Cornell Tech, um centro de pesquisa da universidade Ivy League, Intuit e Technion – Instituto de Tecnologia de Israel.

Morris II cria entradas que, quando processadas por modelos como Gemini, se replicam e realizam atividades maliciosas. O worm é capaz de extrair informações sensíveis, como informações de contato e endereços – e os usuários nem sequer estão cientes de que seus dados estão sendo roubados.

O worm, então, incentiva o sistema de IA a entregá-los a novos agentes, explorando a conectividade dentro do ecossistema Gen AI. É, efetivamente, malware para IA generativa. Os pesquisadores também demonstram como atores mal-intencionados poderiam construir e explorar sistemas semelhantes.

Novos desafios de cibersegurança com ameaças de worms de IA

Worms de inteligência artificial (IA) podem se mover automaticamente entre sistemas, criando novos riscos de cibersegurança como roubo de dados e a disseminação de software nocivo. Esta pesquisa importante mostra que, embora a IA possa melhorar significativamente as tarefas do dia a dia, também cria oportunidades para ciberataques.

Vírus de computador são um tipo de malware. Os worms podem se replicar e se espalhar comprometendo novas máquinas, enquanto também exploram esses sistemas para realizar atividades maliciosas.

Morris II recebeu o nome do infame worm Morris, um dos vírus de computador mais antigos do mundo que causou dezenas de milhares de dólares em danos no final dos anos 1980. O Morris original foi criado por um estudante de Cornell.

Morris II explora brechas em um sistema de IA, injetando comandos maliciosos para instruir a IA a realizar tarefas que violam os acordos de uso do sistema.

Outro trabalho de pesquisa mostrou como os sistemas de IA generativa podem ser manipulados. O desenvolvedor do Claude 3, Anthropic, descobriu que os modelos podem aprender comportamentos enganosos. E pesquisadores em Cingapura criaram um LLM que pode violar as diretrizes do ChatGPT.

Claude 3 vs. ChatGPT: Uma análise comparada

A Anthropic acabou de lançar o Claude 3, estabelecendo novos padrões da indústria de inteligência artificial (IA) em uma ampla variedade de tarefas. Realizamos alguns testes com o Claude 3 (Opus) e o ChatGPT (GPT-4) – confira as nossas conclusões.

O worm Morris II difere de projetos anteriores por ser capaz de direcionar “ecossistemas Gen AI” – ou redes interconectadas de agentes que se relacionam com serviços como ChatGPT.

Os pesquisadores avaliaram o worm em um assistente de e-mail que rodava através de serviços de IA generativa para tarefas como gerar respostas automáticas a e-mails.

Morris II usa métodos tanto passivos baseados em RAG (passivos) quanto de direcionamento de fluxo de aplicação (ativos) para propagação. O passivo se baseia em envenenar um banco de dados para se espalhar quando o sistema recupera os dados infectados, enquanto o método ativo envolve manipular o fluxo da aplicação para propagar o worm.

Os pesquisadores alertam que o impacto da atividade maliciosa de sistemas como Morris II “será mais grave em breve”, à medida que os recursos de IA generativa são integrados a smartphones e carros.

Leia também:

Algoritmo de IA é capaz de rastrear casos de tuberculose; saiba como

Algoritmos de inteligência artificial (IA) – treinados em algoritmos de triagem de tuberculose (TB) – estão levando a um aumento nas notificações e ajudando a identificar 30-40 por cento mais casos na Índia, um país com uma grande parcela do ônus mundial dessa doença infecciosa.

Este post foi modificado pela última vez em %s = human-readable time difference 19:12

Vinicius Siqueira