Microsoft abre acesso à sua ferramenta de testes de segurança para modelos de linguagem

A Microsoft está divulgando ao público a ferramenta interna que usa para identificar vulnerabilidades de segurança em seus modelos generativos de inteligência artificial (IA).

Publicado por

Isabella Caminoto

26 de fevereiro de 2024 09:00

Chamado de PyRIT (Python Risk Identification Toolkit), o testador pode ser usado para avaliar os resultados dos modelos de linguagem para alucinações, preconceitos e geração de conteúdo proibido.

Chatbots de IA também podem ter ‘alucinações’; entenda

No Dia dos Namorados deste ano, o repórter Kevin Roose teve uma interação perturbadora com o chatbot integrado no motor de busca alimentado por inteligência artificial (IA) da Microsoft, o Bing. Saiba mais!

Ele também pode identificar possíveis maneiras de usar o modelo, como geração de malware e jailbreak, bem como possíveis danos à privacidade, como roubo de identidade.

A ferramenta automatiza tarefas de ‘equipe vermelha’ enviando avisos maliciosos. Ao receber uma resposta, ele pontua o modelo e envia um novo prompt para fornecer mais testes.

A Microsoft usou o PyRIT para testar um de seus sistemas assistentes Copilot AI, gerando milhares de prompts maliciosos para avaliar sua capacidade de lidar com entradas nefastas. Usando o PyRIT, o processo de teste foi concluído em questão de horas. Normalmente, os testes levariam semanas.

Microsoft lança Copilot Pro com novos recursos de IA; saiba mais

A Microsoft apresenta o Copilot Pro, uma subscrição premium que aprimora a experiência do Copilot com funcionalidades avançadas.

A Microsoft disse que abriu o PyRIT na esperança de capacitar profissionais de segurança e engenheiros de aprendizado de máquina para encontrar riscos em sistemas generativos de inteligência artificial.

“Isso permite que eles tenham dados empíricos sobre o desempenho de seu modelo hoje e detectem qualquer degradação de desempenho com base em melhorias futuras”, diz a página do PyRIT GitHub .

Leia também:

Humane oferece meses grátis de AI Pin para compensar atraso

A Humane anunciou que seu AI Pin começaria a ser comercializado em março, mas houve um pequeno atraso. Os primeiros usuários agora estão sendo informados de que os pedidos chegarão em meados de abril, no mínimo, de acordo com uma atualização em vídeo do funcionário da Humane Sam Sheffer.

Este post foi modificado pela última vez em %s = human-readable time difference 17:12

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.