[gtranslate]

Inteligência Artificial

OpenAI investiga o funcionamento interno da GPT

Publicado por
Isabella Caminoto

A OpenAI acaba de publicar um novo artigo detalhando um método para realizar engenharia reversa dos conceitos aprendidos por modelos de IA e, assim, entender melhor o funcionamento interno do ChatGPT.

Conheça os detalhes

  • O artigo foi escrito por membros da equipe de “superalinhamento” recentemente dissolvida, incluindo Ilya Sutskever e Jan Leike.
  • O trabalho, intitulado “Dimensionamento e Avaliação de Autoencoders esparsos”, descreve uma técnica para identificar padrões que representam conceitos específicos dentro do GPT-4.
  • Ao utilizar um modelo adicional para sondar o modelo principal, os pesquisadores encontraram uma maneira de extrair milhões de padrões de atividade para exploração posterior.
  • A OpenAI liberou o código-fonte e uma ferramenta de visualização, permitindo que outros explorem como diferentes palavras e frases ativam conceitos dentro dos modelos.

Por que isso importa?

Assim como o recente “Golden Gate Claude” e a pesquisa correspondente da Anthropic, as empresas de IA ainda estão trabalhando para entender o que realmente está acontecendo dentro de seus modelos. Desvendar a “caixa preta” da IA seria um grande passo para melhorar a segurança, o ajuste e a capacidade de controle de modelos que avançam rapidamente.

Leia também:

Este post foi modificado pela última vez em 7 de junho de 2024 12:36

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Trump assina ordem executiva para revisar IA antes do lançamento e reacende debate sobre regulação nos EUA

O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…

3 de junho de 2026

IA na saúde mental herda preconceitos humanos — e pesquisadores alertam para riscos invisíveis

A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…

28 de maio de 2026

Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação

A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…

27 de maio de 2026

Papa Leão XIV lança manifesto histórico sobre IA e alerta: “Nenhum algoritmo pode substituir a humanidade”

A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…

26 de maio de 2026

Google resolve nove problemas matemáticos inéditos com IA e acelera corrida por descobertas científicas

A disputa entre gigantes da inteligência artificial (IA) acaba de atingir um novo patamar —…

25 de maio de 2026

IA no seu pulso: wearables querem prever doenças antes mesmo dos sintomas

Relógios inteligentes, anéis biométricos e pulseiras fitness estão entrando em uma nova fase: deixar de…

21 de maio de 2026